会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
刘建平Pinard
十五年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。
博客园
首页
新随笔
联系
订阅
管理
当前标签:强化学习
强化学习(十九) AlphaGo Zero强化学习原理
刘建平Pinard 2019-03-27 20:11
阅读:37830
评论:69
推荐:14
编辑
强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)
刘建平Pinard 2019-03-04 17:09
阅读:47717
评论:29
推荐:5
编辑
强化学习(十七) 基于模型的强化学习与Dyna算法框架
刘建平Pinard 2019-02-15 20:22
阅读:24464
评论:26
推荐:2
编辑
强化学习(十六) 深度确定性策略梯度(DDPG)
刘建平Pinard 2019-02-01 19:42
阅读:119435
评论:318
推荐:24
编辑
强化学习(十五) A3C
刘建平Pinard 2019-01-29 18:09
阅读:70071
评论:144
推荐:4
编辑
强化学习(十四) Actor-Critic
刘建平Pinard 2019-01-15 17:46
阅读:111445
评论:148
推荐:9
编辑
强化学习(十三) 策略梯度(Policy Gradient)
刘建平Pinard 2018-12-18 18:04
阅读:119167
评论:177
推荐:14
编辑
强化学习(十二) Dueling DQN
刘建平Pinard 2018-11-08 14:04
阅读:57015
评论:74
推荐:5
编辑
强化学习(十一) Prioritized Replay DQN
刘建平Pinard 2018-10-16 16:46
阅读:51246
评论:153
推荐:14
编辑
强化学习(十)Double DQN (DDQN)
刘建平Pinard 2018-10-12 16:52
阅读:105863
评论:77
推荐:8
编辑
强化学习(九)Deep Q-Learning进阶之Nature DQN
刘建平Pinard 2018-10-08 20:40
阅读:67996
评论:84
推荐:11
编辑
强化学习(八)价值函数的近似表示与Deep Q-Learning
刘建平Pinard 2018-09-28 16:49
阅读:87797
评论:203
推荐:13
编辑
强化学习(六)时序差分在线控制算法SARSA
刘建平Pinard 2018-09-09 19:30
阅读:59266
评论:87
推荐:10
编辑
强化学习(五)用时序差分法(TD)求解
刘建平Pinard 2018-08-24 18:23
阅读:75539
评论:131
推荐:16
编辑
强化学习(四)用蒙特卡罗法(MC)求解
刘建平Pinard 2018-08-17 18:04
阅读:71287
评论:108
推荐:17
编辑
强化学习(三)用动态规划(DP)求解
刘建平Pinard 2018-08-12 20:36
阅读:72230
评论:103
推荐:22
编辑
强化学习(二)马尔科夫决策过程(MDP)
刘建平Pinard 2018-08-05 18:09
阅读:155790
评论:142
推荐:26
编辑
强化学习(一)模型基础
刘建平Pinard 2018-07-29 18:53
阅读:149917
评论:75
推荐:35
编辑
公告