会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
刘建平Pinard
十五年码农,对数学统计学,数据挖掘,机器学习,大数据平台,大数据平台应用开发,大数据可视化感兴趣。
博客园
首页
新随笔
联系
订阅
管理
2019年3月27日
强化学习(十九) AlphaGo Zero强化学习原理
摘要: 在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。 本篇主要参考了AlphaGo Zero的论文, AlphaGo Zero综述和AlphaG
阅读全文
posted @ 2019-03-27 20:11 刘建平Pinard
阅读(37758)
评论(69)
推荐(14)
编辑
公告