AlphaGo、AlphaGo zero、Alpha zero

1.神经网络介绍

2.MCTS介绍

3.AlphaGo zero执行过程(伪代码)

参考文章链接:https://blog.csdn.net/hhy_csdn/article/details/86759692

 

一、AlphaGo

1、事件

2016年初,AlphaGo战胜李世石,核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果。

2、主要机制

两个神经网络:策略网和评价网络

 

posted on 2019-09-28 17:16  一抹阳光~绚烂  阅读(1283)  评论(0编辑  收藏  举报

导航