会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Dsp Tian
博客园
首页
新随笔
联系
订阅
管理
2024年6月8日
【Python】DQN处理CartPole-v1
摘要: DQN是强化学习中的一种方法,是对Q-Learning的扩展。 通过引入深度神经网络、经验回放和目标网络等技术,使得Q-Learning算法能够在高维、连续的状态空间中应用,解决了传统Q-Learning方法在这些场景下的局限性。 Q-Learning可以见之前的文章。 算法的几个关键点: 1. 深
阅读全文
posted @ 2024-06-08 16:09 Dsp Tian
阅读(20)
评论(0)
推荐(0)
编辑
公告