摘要: DQN是强化学习中的一种方法,是对Q-Learning的扩展。 通过引入深度神经网络、经验回放和目标网络等技术,使得Q-Learning算法能够在高维、连续的状态空间中应用,解决了传统Q-Learning方法在这些场景下的局限性。 Q-Learning可以见之前的文章。 算法的几个关键点: 1. 深 阅读全文
posted @ 2024-06-08 16:09 Dsp Tian 阅读(20) 评论(0) 推荐(0) 编辑