会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
橘崽崽啊
首页
联系
管理
2022年1月13日
强化学习 马尔可夫过程&动态规划
摘要: 1. 背景介绍 2. 动态特性 3. 价值函数 4. 贝尔曼期望方程 5. 贝尔曼最优方程 6. 策略评估-解析解 7. 策略评估-迭代解 8. 策略改进定理 9. 策略改进-贪心策略 10. 价值迭代
阅读全文
posted @ 2022-01-13 22:01 橘崽崽啊
阅读(95)
评论(0)
推荐(0)
编辑
公告