摘要:
**发表时间:**2021 **文章要点:**这篇文章提出了Discriminator Augmented MBRL (DAM)算法,文章想说model based RL里面,学到的model是不准确的,这个问题也是很难避免的,于是作者换了一个思路,不去修正model,而是通过importance 阅读全文
摘要:
**发表时间:**2021 **文章要点:**文章基于TF-Agent库(model free RL)设计了一个model based RL的库,主要包括三个模块,Environment Model,Agent Classes和Experiment Harness。Environment Model 阅读全文