会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
marsggbo
互道晚安,王者峡谷见
博客园
首页
新随笔
联系
订阅
管理
2019年12月23日
强化学习方法小结
摘要: 花了一天时间大致了解了强化学习一些经典算法,总结成如下笔记。笔记中出现不少流程图,不是我自己画的都标了出处。 铺垫 1. Bellman方程 在介绍强化学习算法之前先介绍一个比较重要的概念,就是 Bellman方程 ,该方程表示动作价值函数,即在某一个状态下,计算出每种动作所对应的value(或者说
阅读全文
posted @ 2019-12-23 17:37 marsggbo
阅读(3166)
评论(0)
推荐(1)
编辑
公告