摘要:
强化学习读书笔记 00 术语和数学符号 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 基本概念 Agent 本体。学习者、决策者。 E 阅读全文
摘要:
强化学习读书笔记 12 资格痕迹(Eligibility Traces) 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 参照 "Rei 阅读全文