2017 年 3月 9 日随笔档案 - SNYang

2017年3月9日

摘要：强化学习读书笔记 08 规划式方法和学习式方法学习笔记： "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 需要了解强化学习的数学符号，先看看这里：阅读全文

posted @ 2017-03-09 15:25 SNYang 阅读(4080) 评论(0) 推荐(0) 编辑

强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)

摘要：强化学习读书笔记 06~07 时序差分学习(Temporal Difference Learning) 学习笔记： "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015 阅读全文

posted @ 2017-03-09 15:23 SNYang 阅读(12133) 评论(0) 推荐(2) 编辑

想想你应该干什么