摘要: 强化学习读书笔记 00 术语和数学符号 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 基本概念 Agent 本体。学习者、决策者。 E 阅读全文
posted @ 2017-03-25 14:46 SNYang 阅读(13430) 评论(4) 推荐(8) 编辑
摘要: 强化学习读书笔记 12 资格痕迹(Eligibility Traces) 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Rei 阅读全文
posted @ 2017-03-25 14:42 SNYang 阅读(9772) 评论(2) 推荐(2) 编辑