摘要: 1. DQN一般使用nature dqn版本效果会更好 2. loss function一般使用huber loss,因为这可以在面对噪声时更加稳定,而MSE在误差较大时也会很大,不利于收敛 阅读全文
posted @ 2020-02-23 10:57 Z_Agent 阅读(520) 评论(2) 推荐(0) 编辑
摘要: 给出第一印象:deque是一个双向队列 from collections import deque a = deque()a = deque(maxlen = 30) #限制长度 a.append(1) a.append(2) a.appendleft(3) print(a) Out[8]: deq 阅读全文
posted @ 2020-02-23 09:51 Z_Agent 阅读(429) 评论(0) 推荐(0) 编辑