快手直播推荐论文《Moment&Cross: Next-Generation Real-Time Cross-Domain CTR Prediction for Live-Streaming Recommendation at Kuaishou》

背景

论文指出直播推荐场景存在两个挑战:

1. 每场直播的时长一般在几个小时左右,同场直播的不同时段用户点击率是不一样的,如何精准的去推荐高处于点击率时刻的直播?

2. 快手app中90%都是短视频,只有10%是直播,直播数据比较稀疏,如何利用用户在短视频场景的行为去更好的推荐直播?

 

捕捉直播间实时点击率

解决挑战1最直接的想法就是实时训练模型,但是直播场景中一些用户行为存在较长时间的延迟,如送礼行为可能需要用户观看半小时后才会发生。如果样本拼接窗口设的过短就会引入许多假负例,设的过长实时性有损。

论文在第一版尝试了快慢窗口结合的方案:

  1. 快窗口等待时间为5min,期间会报告观察到的所有正付样本,此时训练loss为正常的交叉熵损失:

  

  2. 慢窗口的等待时间为1h,只报告5min窗口之后的正样本,此的训练loss为(由于该正样本在5min窗口内被当作负样本训练了一次,训练减去原来作为负样本的loss):

 这种方法在一定程度上解决了上面提到的问题,但是由于在1h窗口正样本回流前,该样本在5min窗口内被当作负样本训练,此时会导致模型低估且仍不够实时,因此论文提出了第二种方案:

即正例实时报告,负列等直播结束后才报告,这样正反馈行为可以得到实时训练

 

短视频transfer到直播

论文采用的方式就是把用户在短视频的行为作为序列特征,采用了GSU + ESU 两阶段的长序列建模方法:

(1)引入通用搜索单元(GSUs)来搜索用户历史,然后筛选出与目标直播候选人相关的项目序列;

(2)设计精确搜索单元(ESUs)来聚合序列信息以压缩用户兴趣,例如序列聚合、目标项目注意力。

 

参考资料

2024快手:直播推荐中的CTR预测实践

posted @ 2024-09-23 18:11  xd_xumaomao  阅读(126)  评论(0编辑  收藏  举报