11 2022 档案
摘要:背景 观看时长(wathc time)是视频推荐中的重要指标之一,提升整体观看时长是视频推荐系统的主要目标。观看时长主要受两个因素的影响:1)用户是否对视频感兴趣;2)视频本身的时长(duration)。 作者分析发现,一方面,100s以下的视频,其观看时长和本身时长有着正相关关系,将视频时长作为输
阅读全文
摘要:背景 在推荐场景,广泛存在长尾分布的现象,即少量的物品频繁的出现,导致正常训练的推荐模型更倾向于推荐流行物品,从而导致马太效应,即流行的物品被更频繁地推荐,并变得更加流行。目前针对这个问题的去偏算法主要可以分成三类: (1)逆权重分数:估计物品流行度的倾向性权重,并对每条数据样本利用逆权重分数进行加
阅读全文
摘要:背景 LambdaRank在RankNet工作的基础上做了改进,介绍LambdaRank之前在回顾一下RankNet。RankNet其实是在优化逆序对的数目,这种优化方式对AUC这类指标非常友好,但是由于没有考虑位置权重,所以和诸如NDCG这类的排序指标不一致。但是NDCG这类的排序指标是不连续的,
阅读全文
摘要:背景 推荐本质上需要完成从全量商品库高效检索Topk相关商品,由于候选商品数量过于庞大,现在的推荐系统一般分为两个阶段:召回和排序。对于召回阶段,面临着从全量商品库里面,高效召回商品的问题,由于存在系统的性能问题,需要重点去解决两个关键问题: 怎么高效检索,即算的快。高效检索意味着需要设计合理的检索
阅读全文