强化学习算法：Learning to Learn: Meta-Critic Networks for Sample Efficient Learning

地址：

作者提出了一种叫做Meta-Critic的框架，该框架可以用于强化学习、监督学习等算法中。该算法在强化学习中可以实现元强化学习中的元迁移强化学习算法。该算法框架具有很好的改进空间，因为这个其实并不是某个算法，而是一个框架，或者说是一种task embedding的结合methodology，因此可以和很多其他算法融合。

posted on 2024-06-05 19:07 Angry_Panda 阅读(43) 评论(0) 编辑收藏举报

刷新页面返回顶部

Angry Panda

强化学习算法：Learning to Learn: Meta-Critic Networks for Sample Efficient Learning

公告

导航