摘要:
QIN一言以蔽之,整体分为两个步骤: 相关行为检索:类似SIM,只不过分为2个阶段。设计相关性搜索单元(Relevance Search Unit, RSU),从历史长期行为序列中检索出和搜索词相关的Top-K1行为;再对每个target item,从Top-K1子序列中检索出相关的Top-K2个行 阅读全文
摘要:
核心:训练两层的item聚类中心,然后在cluster粒度统计用户的兴趣分布,并召回长尾兴趣、多兴趣 参考资料 抖音兴趣建模新突破——Trinity:多兴趣/长期兴趣/长尾兴趣三位一体 阅读全文
摘要:
AAAI'24「快手」观看时长建模:CREAD 阅读全文
摘要:
背景 论文指出直播推荐场景存在两个挑战: 1. 每场直播的时长一般在几个小时左右,同场直播的不同时段用户点击率是不一样的,如何精准的去推荐高处于点击率时刻的直播? 2. 快手app中90%都是短视频,只有10%是直播,直播数据比较稀疏,如何利用用户在短视频场景的行为去更好的推荐直播? 捕捉直播间实时 阅读全文
摘要:
背景 用户冷启动一直是推荐系统中的一个难题,新用户(或非活跃用户)由于缺少行为数据,模型预估不准确。为了改善用户冷启动,腾讯提出了User Interest Enhancement (UIE)模型(论文中提到也可以用于item的冷启动)。基本思想是先对用户聚类,然后用user embedding检索 阅读全文
摘要:
大概看一下模型结构,其实就是在模型里加了一些gate结构,左边EPNet输入场景信息输出不同场景下特征权重,并用场景信息调整特征权重,右边的PPNet几乎就是一个LHUC结构 参考资料 千人千模 | PEPNet: 2023快手多任务多场景建模 阅读全文
摘要:
模型结构 模型主要包含场景抽取层和任务抽取层(上图A): 场景抽取层 场景抽取层主要包括了场景共享专家(Scenario-shared expert)模块、当前场景特有专家(Scenario-specific expert)模块以及场景感知注意力网络,通过这三部分的信息抽取,最终形成了场景层次的信息 阅读全文
摘要:
待整理 参考资料 蒸馏技术在推荐模型中的应用 知识蒸馏在推荐系统的应用 阅读全文
摘要:
1. 常用的损失函数 一般使用inbatch softmax,主要优点是方便,缺点是容易遭造成对热门item的打压,可以做纠偏,参考youtube论文《Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendati 阅读全文
摘要:
TensorFlow简介之负采样 Candidate Sampling简介 求通俗易懂解释下nce loss? 阅读全文