摘要: 神经网络架构和训练、自学习、棋盘对称性、Playout Cap Randomization,结果可视化 从我们之前的文章中,介绍了蒙特卡洛树搜索 (MCTS) 的工作原理以及如何使用它来获得给定棋盘状态的输出策略。我们也理解神经网络在 MCTS 中的两个主要作用;通过神经网络的策略输出来指导探索,并 阅读全文
posted @ 2022-11-29 11:11 deephub 阅读(81) 评论(0) 推荐(0) 编辑