摘要: **发表时间:**2019(ICLR 2019) **文章要点:**这篇文章主要从理论上分析了model based RL的lower bound,然后不断最大化这个lower bound,从而证明了理论上可以单调上升。 这个框架还提出了一个optimism-in-face-of-uncertain 阅读全文
posted @ 2022-02-05 12:08 initial_h 阅读(123) 评论(0) 推荐(0) 编辑
摘要: **发表时间:**2018(NIPS 2018) **文章要点:**这篇文章提出了一个model based 方法probabilistic ensembles with trajectory sampling (PETS),达到了model free方法的performance。主要思路是通过概率 阅读全文
posted @ 2022-02-05 12:02 initial_h 阅读(318) 评论(0) 推荐(0) 编辑