会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
人工智站
博客园
首页
联系
订阅
管理
2019年9月19日
Deep Q Network(DQN)原理解析
摘要: 1. 前言 在前面的章节中我们介绍了时序差分算法(TD)和Q Learning,当状态和动作空间是离散且维数不高时可使用Q Table储存每个状态动作对的Q值,而当状态和动作空间是高维连续时,使用Q Table不动作空间和状态太大十分困难。所以论文Human level control throug
阅读全文
posted @ 2019-09-19 11:08 hyc339408769
阅读(7784)
评论(0)
推荐(0)
编辑
公告