随笔分类 - 推荐系统
摘要:https://mp.weixin.qq.com/s/ZgGbctgV3WsnnqQ0nsDn5w 《KDD'22 | 阿里: 基于EE探索的精排CTR预估》 现有的精排模型主要在收集的曝光数据上进行训练,大多面临着严重的feedback-loop问题:即:模型在曝光数据上进行训练,然后展示item
阅读全文
摘要:https://zhuanlan.zhihu.com/p/351390011 看了这篇文章。有一些总结性的内容,还行。 信息和模型 补充机制 工程框架 跳出固有思维 1、补充Side Information 2、灵活的冷启动机制往往事半功倍 做模型的同学都有一个终极的梦想,“打造一个完美的End2E
阅读全文
摘要:https://zhuanlan.zhihu.com/p/35753281 参考这篇文章。这篇还是讲得不错的。 推荐系统选择商品展现给用户,并期待用户的正向反馈(点击、成交)。然而推荐系统并不能提前知道用户在观察到商品之后如何反馈,也就是不能提前获得本次推荐的收益,唯一能做的就是不停地尝试,并实时收
阅读全文
摘要:https://mp.weixin.qq.com/s/Z_8a7XmlSV1HZuRxEyLdMQ Approximate Softmax 没怎么看懂
阅读全文
摘要:这篇文章再仔细看一下,这篇讲得还不错 https://mp.weixin.qq.com/s/w2U5GBPLmWTDSFKBGaViQQ 《多任务学习经典品读:MMoE 应用篇》 优化的多个目标往往不同,有时相互冲突。例如,除了点击观看视频(ctr)外,我们可能还想推荐给用户评价较高或者更可能个朋友
阅读全文
摘要:https://mp.weixin.qq.com/s/SCFzFIshY9a2wdsPnfffVA 从美团这篇推荐文章里看看一些信息 https://mp.weixin.qq.com/s/axgC09tpzx2p4tb0p7-fPA NLP 的 不可能三角 对模型规模(缺 P1): 一般在超大模型显
阅读全文
摘要:http://www.javashuo.com/article/p-rxroemrk-eo.html 《推荐系统赶上深度学习(十二)--推荐系统中的EE问题及基本Bandit算法》 4.1 朴素Bandit算法 4.2 Epsilon-Greedy算法 4.3 Thompson sampling算法
阅读全文
摘要:https://www.freesion.com/article/17781256797/ 《UCB算法升职记——LINUCB算法》 这篇也不怎么样,讲得有点空洞 我们再把UCB算法要解决的问题描述一下: 面对固定的K个item(广告或推荐物品),我们没有任何先验知识,每一个item的回报情况完全不
阅读全文
摘要:看了这两篇文章,基本看懂了 https://zhuanlan.zhihu.com/p/373074729 《swing算法》 https://zhuanlan.zhihu.com/p/364593067 《Swing算法介绍、实现与在阿里飞猪的实战应用》 一言蔽之,传统的协同过滤更加直观,直接依赖共
阅读全文