摘要:
强化学习读书笔记 10 on policy控制的近似方法 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Reinforceme 阅读全文
摘要:
强化学习读书笔记 09 on policy预测的近似方法 参照 "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" "强化学习读书笔记 00 术语和数学 阅读全文