会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Clivia Du
A student of CS who enjoys electronic design
博客园
首页
联系
订阅
管理
2022年7月6日
强化学习-学习笔记6 | 蒙特卡洛算法
摘要:
Monte Carlo Algorithms. 蒙特卡洛算法是一大类随机算法,又称为随机抽样或统计试验方法,通过随机样本估计真实值,用随机逼近精确。
阅读全文
posted @ 2022-07-06 18:11 climerecho
阅读(1234)
评论(0)
推荐(2)
编辑
强化学习-学习笔记5 | AlphaGo
摘要:
从强化学习的角度理解一下AlphaGo的实现思路,机器是如何在围棋这样高复杂度的情境下战胜人类的。通过这个实例加深对价值网络和策略网络的理解,并熟悉一下蒙特卡洛树搜索方法 MCTS。
阅读全文
posted @ 2022-07-06 11:56 climerecho
阅读(624)
评论(3)
推荐(1)
编辑
公告