摘要: 在传统的DQN(Deep Q-Learning Network)和DDQN(Double Deep Q-Learning Network)之间,主要区别如下: 1. Q值估计的目标函数不同: DQN: 在DQN中,目标Q值是通过最大化Q值的动作直接由同一个网络(目标网络)计算得到的。这可能会导致Q值 阅读全文
posted @ 2024-12-20 13:53 GraphL 阅读(20) 评论(0) 推荐(0) 编辑