摘要: 强化学习读书笔记 02 多臂老O虎O机问题 学习笔记: "Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016" 数学符号的含义 通用 $a$ 行动(acti 阅读全文
posted @ 2017-02-27 20:02 SNYang 阅读(5669) 评论(0) 推荐(4) 编辑