会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
刘建平Pinard
十五年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。
博客园
首页
新随笔
联系
订阅
管理
我的随笔
上一页
1
2
3
4
5
6
···
14
下一页
强化学习(十六) 深度确定性策略梯度(DDPG)
刘建平Pinard 2019-02-01 19:42
阅读:119435
评论:318
推荐:24
编辑
强化学习(十五) A3C
刘建平Pinard 2019-01-29 18:09
阅读:70071
评论:144
推荐:4
编辑
强化学习(十四) Actor-Critic
刘建平Pinard 2019-01-15 17:46
阅读:111445
评论:148
推荐:9
编辑
强化学习(十三) 策略梯度(Policy Gradient)
刘建平Pinard 2018-12-18 18:04
阅读:119166
评论:177
推荐:14
编辑
强化学习(十二) Dueling DQN
刘建平Pinard 2018-11-08 14:04
阅读:57015
评论:74
推荐:5
编辑
强化学习(十一) Prioritized Replay DQN
刘建平Pinard 2018-10-16 16:46
阅读:51246
评论:153
推荐:14
编辑
强化学习(十)Double DQN (DDQN)
刘建平Pinard 2018-10-12 16:52
阅读:105863
评论:77
推荐:8
编辑
强化学习(九)Deep Q-Learning进阶之Nature DQN
刘建平Pinard 2018-10-08 20:40
阅读:67996
评论:84
推荐:11
编辑
强化学习(八)价值函数的近似表示与Deep Q-Learning
刘建平Pinard 2018-09-28 16:49
阅读:87797
评论:203
推荐:13
编辑
强化学习(七)时序差分离线控制算法Q-Learning
刘建平Pinard 2018-09-19 19:32
阅读:60021
评论:109
推荐:15
编辑
上一页
1
2
3
4
5
6
···
14
下一页
公告