关于DQN算法中的一些tips

1. DQN一般使用nature dqn版本效果会更好

2. loss function一般使用huber loss,因为这可以在面对噪声时更加稳定,而MSE在误差较大时也会很大,不利于收敛

posted @ 2020-02-23 10:57  Z_Agent  阅读(520)  评论(2编辑  收藏  举报