摘要: 强化学习读书笔记 13 策略梯度方法(Policy Gradient Methods) 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 阅读全文
posted @ 2017-03-26 21:54 SNYang 阅读(15804) 评论(0) 推荐(1) 编辑