随笔档案「2021年7月5日」：RECURRENT EXPERIENCE REPLAY IN DISTRIBUT... - initial_h

2021年7月5日

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING（R2D2）

摘要： **发表时间：**2019 ICLR **文章要点：**文章在Q-learning的基础上加上rnn结构，提出了解决rnn中hidden state如何用来更新的问题。以前的rnn的初始hidden state直接输入0，这会造成和真正的hidden state有偏差的问题（initial recu 阅读全文

posted @ 2021-07-05 09:11 initial_h 阅读(234) 评论(0) 推荐(0)

initial_h

https://github.com/initial-h

公告