2017 年 3月 11 日随笔档案 - SNYang

2017年3月11日

摘要：强化学习读书笔记 10 on policy控制的近似方法学习笔记： "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Reinforceme 阅读全文

posted @ 2017-03-11 22:27 SNYang 阅读(1969) 评论(0) 推荐(0) 编辑

强化学习读书笔记 - 09 - on-policy预测的近似方法

摘要：强化学习读书笔记 09 on policy预测的近似方法参照 "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" "强化学习读书笔记 00 术语和数学阅读全文

posted @ 2017-03-11 16:54 SNYang 阅读(2628) 评论(0) 推荐(2) 编辑

想想你应该干什么