05 2022 档案
ICLR 2017-RL2: Fast Reinforcement Learning via Slow Reinforcement Learning
摘要:利用循环神经网络来进行先验知识的学习,进而优化RL model
ICML 2017-Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
摘要:利用第一次梯度对第二次梯度进行提升。