embedding的冷启动
https://zhuanlan.zhihu.com/p/351390011
看了这篇文章。有一些总结性的内容,还行。
- 信息和模型
- 补充机制
- 工程框架
- 跳出固有思维
1、补充Side Information
2、灵活的冷启动机制往往事半功倍
做模型的同学都有一个终极的梦想,“打造一个完美的End2End的模型,一个模型干净利索的解决所有问题”。这个想法当然是值得追求的,但是我们也不必落入“完美主义”的怪圈。
在Airbnb那篇经典的Embedding文章中,所采用的冷启动机制就很实用。(论文地址:https://www.kdd.org/kdd2018/accepted-papers/view/real-time-personalization-using-embeddings-for-search-ranking-at-airbnb)找到三个相似的有Embedding的短租屋,然后取其Embedding的平均。多么简单使用的冷启动策略。
比如利用聚类快速定位新物品所在的cluster,找到相似物品。
再比如根据用户/物品的特征训练一颗决策树,再把冷启动的用户/物品根据有限的信息分配到决策树的某个分支中去,再根据分支对应的默认列表进行推荐等等。
要点总结
最后,解决Embedding冷启动问题,重要的思路再说一遍。
- 补充side information
- 利用EGES的类似方案,在Embedding模型中加入更多非行为历史类特征,让Embedding能够覆盖更多物品和用户
- 利用Amazon Video方案,直接在主模型中加入更多物品、用户特征,即使没有Embedding也可以做出靠谱的预测
- 灵活的冷启动机制
- 不要陷入“完美主义”的怪圈
- 采用Airbnb方案,利用物品之间的相似性,对冷启动物品根据相似物品,快速生成初始化Embedding
- 聚类,决策树等经典模型
- 工程框架的改进
- 批处理->流处理->实时推断->边缘计算,让新信号的消费变得越来越实时
- 跳出固有思维
- 使用探索与利用、主动学习等思路解决问题
- 寻求更广阔的合作,与产品、运营、数据团队做团队间的合作
分类:
推荐系统
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2017-06-24 推荐-相关策略算法
2017-06-24 检验开发团队好不好的12个问题