会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
静候佳茵
博客园
首页
新随笔
联系
订阅
管理
2022年2月28日
强化学习入门知识与经典项目分析1.3
摘要: 上一篇文章推导了贝尔曼方程,这一篇文章来继续分享对应的马尔可夫决策的案例,然后引入策略评估并证明其收敛性。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0.
阅读全文
posted @ 2022-02-28 16:09 静候佳茵
阅读(533)
评论(0)
推荐(0)
编辑
公告