摘要: **发表时间:**2021(ICLR 2021) **文章要点:**这篇文章提出了一个解决sparse extrinsic rewards的办法AMIGO。思路就是用一个goal-generating teacher来生成难度适中的任务目标(constructively adversarial ob 阅读全文
posted @ 2021-11-01 12:51 initial_h 阅读(149) 评论(0) 推荐(0) 编辑
摘要: **发表时间:**2021(ICLR 2021) **文章要点:**这篇文章想说,在state里面其实有很多任务无关的东西,如果用Reconstruction之类的方式去做就还是会考虑这些东西,作者提出用Bisimulation metric去做representation,让latent spac 阅读全文
posted @ 2021-11-01 12:38 initial_h 阅读(341) 评论(0) 推荐(0) 编辑