摘要: **发表时间:**2019(NeurIPS 2019) **文章要点:**文章简单理论分析了一下model-based RL的单调收敛,然后做实验验证生成很多的短的rollouts会有比较好的效果(using short model-generated rollouts branched from 阅读全文
posted @ 2022-01-07 08:42 initial_h 阅读(303) 评论(0) 推荐(0) 编辑