会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
哆啦哆啦
博客园
首页
新随笔
联系
订阅
管理
2023年1月15日
用模仿学习来学习POMDP中的信念表示
摘要: 一、研究对象 本文研究了POMDP的模仿学习问题,具体来说本文在POMDP中引入了一种的信念表示学习方法,用于生成对抗模仿学习,不同于以往单独训练信念模块和策略,我们对信念模块和策略进行联合学习,使用任务感知模仿损失来确保目标表示更加符合策略目标。 为了避免这种潜在的信念退化,我们引入了集中信息性的
阅读全文
posted @ 2023-01-15 14:03 哆啦哆啦呦
阅读(214)
评论(0)
推荐(0)
编辑
公告