会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
feifanren
博客园
首页
新随笔
联系
订阅
管理
2020年8月9日
强化学习学习笔记(5):
摘要: 在前面的介绍中,我们都是使用参数θ近似动作值或状态值函数, $\begin {V_\theta }\left( s \right) \approx {V^\pi }\left( s \right) \ {Q_\theta }\left( {s,a} \right) \approx {Q^\pi }\
阅读全文
posted @ 2020-08-09 22:04 feifanren
阅读(226)
评论(0)
推荐(0)
编辑
公告