摘要: 强化学习读书笔记 08 规划式方法和学习式方法 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 需要了解强化学习的数学符号,先看看这里: 阅读全文
posted @ 2017-03-09 15:25 SNYang 阅读(4080) 评论(0) 推荐(0) 编辑
摘要: 强化学习读书笔记 06~07 时序差分学习(Temporal Difference Learning) 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015 阅读全文
posted @ 2017-03-09 15:23 SNYang 阅读(12133) 评论(0) 推荐(2) 编辑