会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
SkyRainWind
空を見ろ。空を見続けろ。答えはそこにある。
首页
新随笔
管理
2024年4月16日
IL 相关读论文记录
摘要: 读读读 RILIR 链接:https://arxiv.org/pdf/2310.14274.pdf 本文主要是对 IRL 的改进。 首先,设计了一个提取关键信息的网络 \(\phi(o_t)\) 来克服原始 IRL 中 expert 数据所在环境和 learning 环境不一样的问题。 接着,再设计
阅读全文
posted @ 2024-04-16 20:49 SkyRainWind
阅读(31)
评论(0)
推荐(0)
编辑
公告