摘要: **发表时间:**2002(Machine Learning, 47, 235–256, 2002) **文章要点:**这篇文章主要是分析了针对Multiarmed Bandit Problem的几个经典算法的收敛性。我们知道这类问题主要就是在解决exploration versus exploit 阅读全文
posted @ 2023-03-20 07:45 initial_h 阅读(166) 评论(0) 推荐(0) 编辑