摘要: **发表时间:**2020 **文章要点:**MCTS里通常通过计算访问次数来做探索,这个被称作count-derived uncertainty。这篇文章提出了第二种uncertainty,这种uncertainty来源于子树的大小,一个直觉的想法就是,如果一个动作对应下的子树小,那就不用探索那么 阅读全文
posted @ 2023-04-20 23:14 initial_h 阅读(30) 评论(0) 推荐(0) 编辑