2022年11月7日

推荐系统与强化学习之bandit

摘要：目录： MAB的定义及意义 MAB算法 ε-Greedy 算法 UCB算法汤普森抽样一、MAB（Multi-Armed Bandit）的定义及意义 1、在推荐系统中，为了解决准确率和多样性的平衡问题就是经典的Exploit－Explore【利用与探索问题】。其中，Exploit表示的是利用当前用阅读全文

posted @ 2022-11-07 20:52 ljy2013 阅读(377) 评论(0) 推荐(0) 编辑

2022年11月7日

公告

导航