摘要: 花了一天时间大致了解了强化学习一些经典算法,总结成如下笔记。笔记中出现不少流程图,不是我自己画的都标了出处。 铺垫 1. Bellman方程 在介绍强化学习算法之前先介绍一个比较重要的概念,就是 Bellman方程 ,该方程表示动作价值函数,即在某一个状态下,计算出每种动作所对应的value(或者说 阅读全文
posted @ 2019-12-23 17:37 marsggbo 阅读(3166) 评论(0) 推荐(1) 编辑