会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Poll的笔记
[三叶草精神] what hurts more,the pain of hard work or the pain of regret?
博客园
首页
联系
订阅
管理
2018年10月30日
[Reinforcement Learning] Model-Free Prediction
摘要: 上篇文章介绍了 Model based 的通用方法——动态规划,本文内容介绍 Model Free 情况下 Prediction 问题,即 "Estimate the value function of an unknown MDP"。 Model based:MDP已知,即转移矩阵和奖赏函数均已知
阅读全文
posted @ 2018-10-30 09:37 Poll的笔记
阅读(1997)
评论(1)
推荐(2)
编辑
公告