随笔档案「2021年8月21日」：Decision Transformer: Reinforcement Lear... - initial_h

2021年8月21日

Decision Transformer: Reinforcement Learning via Sequence Modeling

摘要： **发表时间：**2021 **文章要点：**这篇文章提出了一个Decision Transformer的模型，在offline RL的设定下，不用RL的方法学value function，也不需要做policy improvement，就可以达到甚至超过offline RL baseline。具体阅读全文

posted @ 2021-08-21 09:21 initial_h 阅读(898) 评论(0) 推荐(0)

initial_h

https://github.com/initial-h

公告