摘要: **发表时间:**2020(NeurIPS 2020) **文章要点:**这篇文章提出了一个叫mixreg的方法来提高agent泛化性。大致方法就是说用多个环境训练,并且对环境做插值,这样学到的策略就会更平滑,泛化性就更好。具体的,我有两个状态,通过加权插值的方式得到一个新的状态 这里权重λ通过从贝 阅读全文
posted @ 2021-10-28 10:19 initial_h 阅读(128) 评论(0) 推荐(0) 编辑