摘要: 强化学习-学习笔记6 | 蒙特卡洛算法 Monte Carlo Algorithms. 蒙特卡洛算法是一大类随机算法,又称为随机抽样或统计试验方法,通过随机样本估计真实值,用随机逼近精确。 阅读全文
posted @ 2022-07-06 18:11 climerecho 阅读(1234) 评论(0) 推荐(2) 编辑
摘要: 强化学习-学习笔记5 | AlphaGo 从强化学习的角度理解一下AlphaGo的实现思路,机器是如何在围棋这样高复杂度的情境下战胜人类的。通过这个实例加深对价值网络和策略网络的理解,并熟悉一下蒙特卡洛树搜索方法 MCTS。 阅读全文
posted @ 2022-07-06 11:56 climerecho 阅读(624) 评论(3) 推荐(1) 编辑