05 2022 档案

ICLR 2018-A Simple Neural Attentive Meta-Learner
摘要:利用时序卷积+注意力机制弥补RNN的不足
201
0
0
lec-5-Policy Gradients
摘要:策略梯度的基本原理及理解
42
0
0
lec-4-Introduction to Reinforcement Learning
摘要:介绍强化学习的基本要素以及各种算法
33
0
0
ICLR 2017-RL2: Fast Reinforcement Learning via Slow Reinforcement Learning
摘要:利用循环神经网络来进行先验知识的学习,进而优化RL model
195
0
0
ICML 2017-Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
摘要:利用第一次梯度对第二次梯度进行提升。
44
0
0
CogSci 2017-Learning to reinforcement learn
摘要:元学习系统(监督+从属)扩展于RL设置
85
0
0
ICANN 2001-Learning to Learn Using Gradient Descent
摘要:利用梯度下降进行元学习
43
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起