摘要: 基于 14 年的 MFRL 论文,利用相邻 state-action 的空间相关性来加速学习,用 gaussian processes 建模 env dynamics(model-based)/ Q function(model-free),得到了两种跟 14 年 MFRL 很相似的算法。 阅读全文
posted @ 2023-04-16 13:21 MoonOut 阅读(96) 评论(0) 推荐(0) 编辑