会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
从流域到海域
博客园
首页
新随笔
联系
管理
订阅
2019年10月11日
Compute the Optimal Policy & the Optimal Value 计算最佳策略和计算最佳价值
摘要: MDP Control 在这节内容里我们不讨论如何学习策略,我们仅仅探讨计算最佳策略。 计算最佳策略和计算最佳价值都属于MDP ...
阅读全文
posted @ 2019-10-11 17:24 从流域到海域
阅读(135)
评论(0)
推荐(0)
编辑
公告