2017 年 3月 26 日随笔档案 - SNYang

2017年3月26日

强化学习读书笔记 - 13 - 策略梯度方法(Policy Gradient Methods)

摘要：强化学习读书笔记 13 策略梯度方法(Policy Gradient Methods) 学习笔记： "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 阅读全文

posted @ 2017-03-26 21:54 SNYang 阅读(15804) 评论(0) 推荐(1) 编辑

想想你应该干什么