EE和UCB/LinUCB

http://www.javashuo.com/article/p-rxroemrk-eo.html

《推荐系统赶上深度学习(十二)--推荐系统中的EE问题及基本Bandit算法》

 

 

 

4.1 朴素Bandit算法

4.2 Epsilon-Greedy算法

4.3 Thompson sampling算法

4.4 UCB算法

 

 

 

https://zhuanlan.zhihu.com/p/360376856

这篇文章转载了一些冷启动的观点,还可以

 

对于新用户来说,虽然他们的消费价值为产品带来的收益不是很大,但他们的留存是非常关键的。现在产品都讲用户增长,为了获取一个新用户可能会花大量的广告费和宣传,好不容易把用户搞到我们产品上了,结果上来一看推荐的内容不感兴趣,可能很快就卸载流失掉了。如果新用户冷启推荐的好,会让这部分用户留下来,最终产品的用户量就会稳步增长。

对于新物品来说,以视频为例,100个作者新发的视频往往只有10个是优质视频并预期能得到平均水准以上的消费,那么通过模型预估视频的价值并为可能成为热门的视频增加推荐权重就能让爆款尽快的出来,另外90个也要合理的推荐,在尽量不影响大盘核心指标的情况下,提高作者的发文积极性,只有作者们愿意花时间创造更多的内容,才能让产品内容生态更加丰富。

 

1. 策略规则和简单模型阶段

2. EE探索阶段

3. 元学习阶段

4. 主动学习

 

里面引用了下面两篇文章:

 

Embedding冷启动问题

https://zhuanlan.zhihu.com/p/351390011

 

Contextual Bandit算法在推荐系统中的实现及应用

https://zhuanlan.zhihu.com/p/35753281

 

还还提到了元学习和MAML

https://blog.csdn.net/weixin_42392454/article/details/109891791

 

posted @ 2022-06-23 20:12  blcblc  阅读(293)  评论(0编辑  收藏  举报