2024 年 6月 8 日随笔档案 - Dsp Tian

2024年6月8日

摘要： DQN是强化学习中的一种方法，是对Q-Learning的扩展。通过引入深度神经网络、经验回放和目标网络等技术，使得Q-Learning算法能够在高维、连续的状态空间中应用，解决了传统Q-Learning方法在这些场景下的局限性。 Q-Learning可以见之前的文章。算法的几个关键点： 1. 深阅读全文

posted @ 2024-06-08 16:09 Dsp Tian 阅读(20) 评论(0) 推荐(0) 编辑

Dsp Tian

公告