会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
_1024
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2017年8月16日
强化学习(David Silver)4:免模型学习
摘要: 0、为什么免模型学习? 0、为什么免模型学习? 在已知的MDP中,可以使用DP来计算求解RL 但是在未知MDP中,没有转移函数,不能直接求解,此时MDP未知,需要使用采样方法,也就是本课中的Model-Free方法 PS:课程中迭代的值是值函数;周志华老师的西瓜书中迭代的是状态值函数;课程中迭代的是
阅读全文
posted @ 2017-08-16 22:31 _1024
阅读(450)
评论(0)
推荐(0)
编辑