强化学习算法:Learning to Learn: Meta-Critic Networks for Sample Efficient Learning

地址:

https://arxiv.org/pdf/1706.09529



作者提出了一种叫做Meta-Critic的框架,该框架可以用于强化学习、监督学习等算法中。该算法在强化学习中可以实现元强化学习中的元迁移强化学习算法。该算法框架具有很好的改进空间,因为这个其实并不是某个算法,而是一个框架,或者说是一种task embedding的结合methodology,因此可以和很多其他算法融合。



image



posted on 2024-06-05 19:07  Angry_Panda  阅读(43)  评论(0编辑  收藏  举报

导航