摘要: **发表时间:**2019 ICLR **文章要点:**文章在Q-learning的基础上加上rnn结构,提出了解决rnn中hidden state如何用来更新的问题。以前的rnn的初始hidden state直接输入0,这会造成和真正的hidden state有偏差的问题(initial recu 阅读全文
posted @ 2021-07-05 09:11 initial_h 阅读(197) 评论(0) 推荐(0) 编辑