快手直播推荐论文《Moment&Cross: Next-Generation Real-Time Cross-Domain CTR Prediction for Live-Streaming Recommendation at Kuaishou》

背景

论文指出直播推荐场景存在两个挑战：

1. 每场直播的时长一般在几个小时左右，同场直播的不同时段用户点击率是不一样的，如何精准的去推荐高处于点击率时刻的直播？

2. 快手app中90%都是短视频，只有10%是直播，直播数据比较稀疏，如何利用用户在短视频场景的行为去更好的推荐直播？

解决挑战1最直接的想法就是实时训练模型，但是直播场景中一些用户行为存在较长时间的延迟，如送礼行为可能需要用户观看半小时后才会发生。如果样本拼接窗口设的过短就会引入许多假负例，设的过长实时性有损。

论文在第一版尝试了快慢窗口结合的方案：

　　1. 快窗口等待时间为5min，期间会报告观察到的所有正付样本，此时训练loss为正常的交叉熵损失：

　　2. 慢窗口的等待时间为1h，只报告5min窗口之后的正样本，此的训练loss为（由于该正样本在5min窗口内被当作负样本训练了一次，训练减去原来作为负样本的loss）：

这种方法在一定程度上解决了上面提到的问题，但是由于在1h窗口正样本回流前，该样本在5min窗口内被当作负样本训练，此时会导致模型低估且仍不够实时，因此论文提出了第二种方案：

即正例实时报告，负列等直播结束后才报告，这样正反馈行为可以得到实时训练

论文采用的方式就是把用户在短视频的行为作为序列特征，采用了GSU + ESU 两阶段的长序列建模方法：

（1）引入通用搜索单元（GSUs）来搜索用户历史，然后筛选出与目标直播候选人相关的项目序列；

（2）设计精确搜索单元（ESUs）来聚合序列信息以压缩用户兴趣，例如序列聚合、目标项目注意力。

posted @ 2024-09-23 18:11 xd_xumaomao 阅读(273) 评论(0) 编辑收藏举报

刷新页面返回顶部