摘要: (译) 强化学习 第一部分:Q-Learning 以及相关探索 Q-Learning review: Q-Learning 的基础要点是:有一个关于环境状态S的表达式,这些状态中可能的动作 a,然后你学习这些状态下他们action的值。直观的讲,这个值,Q,是 状态-动作值(state-action 阅读全文
posted @ 2016-06-10 16:45 AHU-WangXiao 阅读(667) 评论(0) 推荐(0) 编辑