会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
initial_h
https://github.com/initial-h
博客园
首页
新随笔
管理
2021年7月29日
Convex Regularization in Monte-Carlo Tree Search
摘要: **发表时间:**2021(ICML 2021) **文章要点:**之前PUCT的MCTS收敛速度是多项式的,这篇文章提出了凸正则化的方式将收敛速度提高到了指数级。主要修改的是PUCT这个采样策略,以及Q value的更新方式。通过Legendre-Fenchel transform把学Q变成了学一
阅读全文
posted @ 2021-07-29 23:54 initial_h
阅读(109)
评论(0)
推荐(0)
编辑
公告