会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ljy2013
2022年11月7日
推荐系统与强化学习之bandit
摘要: 目录: MAB的定义及意义 MAB算法 ε-Greedy 算法 UCB算法 汤普森抽样 一、MAB(Multi-Armed Bandit)的定义及意义 1、在推荐系统中,为了解决准确率和多样性的平衡问题就是经典的Exploit-Explore【利用与探索问题】。其中,Exploit表示的是利用当前用
阅读全文
posted @ 2022-11-07 20:52 ljy2013
阅读(377)
评论(0)
推荐(0)
编辑
公告
导航
博客园
首页
新随笔
新文章
联系
订阅
管理