会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
initial_h
https://github.com/initial-h
博客园
首页
新随笔
管理
2021年10月21日
MOPO: Model-based Offline Policy Optimization
摘要: **发表时间:**2020(NeurIPS 2020) **文章要点:**目前主流的offline RL的方法都是model free的,这类方法通常需要将policy限制到data覆盖的集合范围里(support),不能泛化到没见过的状态上。作者提出Model-based Offline Poli
阅读全文
posted @ 2021-10-21 10:42 initial_h
阅读(951)
评论(0)
推荐(0)
编辑
公告