随笔档案「2021年10月28日」：Improving Generalization in Reinforcemen... - initial_h

2021年10月28日

Improving Generalization in Reinforcement Learning with Mixture Regularization

摘要： **发表时间：**2020（NeurIPS 2020） **文章要点：**这篇文章提出了一个叫mixreg的方法来提高agent泛化性。大致方法就是说用多个环境训练，并且对环境做插值，这样学到的策略就会更平滑，泛化性就更好。具体的，我有两个状态，通过加权插值的方式得到一个新的状态这里权重λ通过从贝阅读全文

posted @ 2021-10-28 10:19 initial_h 阅读(151) 评论(0) 推荐(0)

initial_h

https://github.com/initial-h

公告