2019 年 12月 23 日随笔档案 - marsggbo

2019年12月23日

摘要：花了一天时间大致了解了强化学习一些经典算法，总结成如下笔记。笔记中出现不少流程图，不是我自己画的都标了出处。铺垫 1. Bellman方程在介绍强化学习算法之前先介绍一个比较重要的概念，就是 Bellman方程，该方程表示动作价值函数，即在某一个状态下，计算出每种动作所对应的value（或者说阅读全文

posted @ 2019-12-23 17:37 marsggbo 阅读(3166) 评论(0) 推荐(1) 编辑

marsggbo

互道晚安，王者峡谷见

公告