会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Poll的笔记
[三叶草精神] what hurts more,the pain of hard work or the pain of regret?
博客园
首页
联系
订阅
管理
2018年11月1日
[Reinforcement Learning] Value Function Approximation
摘要: 为什么需要值函数近似? 之前我们提到过各种计算值函数的方法,比如对于 MDP 已知的问题可以使用 Bellman 期望方程求得值函数;对于 MDP 未知的情况,可以通过 MC 以及 TD 方法来获得值函数,为什么需要再进行值函数近似呢? 其实到目前为止,我们介绍的值函数计算方法都是通过查表的方式获取
阅读全文
posted @ 2018-11-01 09:46 Poll的笔记
阅读(1997)
评论(0)
推荐(0)
编辑
公告