Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction

Qi P., Zhu X., Zhou G., Zhang Y., Wang Z., Ren L., Fan Y. and Gai K. Search-based user interest modeling with lifelong sequential behavior data for click-through rate prediction. CIKM, 2020.

听说 SIM 在工业界广受赞誉, 特此记一笔.

Search-based Interest Model (SIM)

  • SIM 的目的是更好地挖掘用户的长期兴趣. 但是直接处理用户成千上万的交互历史在效率和效果上可能都不是最优的. 于是 SIM:
    1. 希望从长序列中抽取出合适的子序列;
    2. 从子序列中挖掘出用户的兴趣.

子序列抽取

  • 子序列的抽取 SIM 提出了两种方案, 一种是 soft search 另一种是 hard search:
    • soft search: 给定整个的历史序列 embeddings E=[e1;e2;;eT], 以及 target ea, 通过 maximum inner product search 来快速检索出匹配 ea 的 top-K 的子序列;
    • hard search: 则是直接筛选出和 target 类别一致的子序列.

注: 作者认为, 长序列和短序列的建模是不同的, 所以不应该采用端到端的训练方法, 所以这一部分训练时采取一般的 CTR 进行训练的.

Exact Search Unit

  • 根据上面的搜索, 我们已经确定了子序列:

    E=[e1;e2;;eK].

  • 此外, 作者认为, 每个 item 的重要性是不同的, 需要进一步强调时间间隔, 定义

    D=[Δ1;Δ2;;ΔK].

    这里 Δk 是第 k 个交互样本和 target 的时间间隔, 然后将其编码成 embedding:

    Et=[e1t;e2t;;eKt].

  • 接着二者凭借得到: zj=concat(ej,ejt).

  • 然后通过多头注意力计算相似度:

    attscorei=Softmax(WbizbWaiea),Ult=concat(attscoreiz1;;attscoreizb).

  • Ult 喂到一个 MLP 中用于 CTR.

posted @   馒头and花卷  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2023-02-26 When AUC meets DRO: Optimizing Partial AUC for Deep Learning with Non-Convex Convergence Guarantee
2023-02-26 Learning Models with Uniform Performance via Distributionally Robust Optimization
点击右上角即可分享
微信分享提示