摘要: **发表时间:**2021(ICML 2021) **文章要点:**这篇文章提出了demonstration-conditioned reinforcement learning (DCRL)来做Few-Shot Imitation,将demonstration和当前状态作为输入,通过强化学习最大化 阅读全文
posted @ 2023-04-10 07:35 initial_h 阅读(45) 评论(0) 推荐(0) 编辑