Benchmarking Model-Based Reinforcement Learning

发表时间:2019
文章要点:这篇文章就和标题一样,做了很多个model based RL的benchmark。提供了11种 MBRL和4种MFRL算法以及18个环境。文章把MBRL算法分成三类:

  1. Dyna-style Algorithms
  2. Policy Search with Backpropagation through Time
  3. Shooting Algorithms
    然后给出了实验结果



    总结:不过只做了连续动作的环境,没有Atari。
    疑问:无。
posted @ 2021-12-23 11:27  initial_h  阅读(107)  评论(0编辑  收藏  举报