会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
静候佳茵
博客园
首页
新随笔
联系
订阅
管理
2022年2月25日
强化学习入门知识与经典项目分析1.2
摘要: 我们在上一篇文章中详细推导了马尔可夫奖励过程的贝尔曼公式,这一篇文章重点来推导马尔科夫决策过程的贝尔曼公式。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0
阅读全文
posted @ 2022-02-25 18:30 静候佳茵
阅读(98)
评论(0)
推荐(0)
编辑
公告