摘要: 强化学习读书笔记 11 off policy的近似方法 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Reinforcemen 阅读全文
posted @ 2017-03-12 00:04 SNYang 阅读(1851) 评论(1) 推荐(0) 编辑