Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations

Zhai J., Liao L., Liu X., Wang Y., Li R., Cao X., Gao L., Gong Z., Gu F., He M., Lu Y. and Shi Y. Actions speak louder than words: Trillion-parameter sequential transducers for generative recommendations

本文介绍了一种推荐大模型的框架的训练方法.

GRs (Generative Recommenders)

任务形式

  • 如上图所示, DRs 这里把 E/F, G, H 分别进行 merge and sequentialize, 这里 (E, F) 表示哪些用户的交互行为, merge 后得到的是 (Φ,a,t): (Context, action, timestamp), 二 G, H 则是一些 "not related to user-content engagements".

  • 对于 ranking, 作者设计的任务是:

    P(ai|Φi,ai1,,a0,Φ0),

    即通过过往的信息预测下一个 action.

  • 对于 retrieval, 作者设计的任务是仅对那些 ai 为 positive 的情况进行:

    P(Φi|ai1,Φi1,,a0,Φ0).

    negative 的 action 不进行预测.

模型设计

  • 作者为了兼顾效率, 特别改进了模型框架:

  • 注意到, 其中的每个模块变成了:

o

  • 虽然形式上和 attention 还是比较像的, 但是注意到:
    1. Q(X)K(X)T 并没有经过 softmax 处理, 作者认为这样除了效率外, 还能够保证不同的参与度能够有所区分;
    2. U(X), 门控机制的引入 (作者用来模拟 MoE).

  • 可以发现, softmax 这个点的影响很大.

  • 此外, 还有数据集的切分, 优化器的选择等等.

虽然最后的效果并没有特别夸张, 但是这些尝试是值得肯定的.

代码

[official]

posted @   馒头and花卷  阅读(909)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2023-05-26 STAMP: Short-Term Attention Memory Priority Model for Session-based Recommendation
2023-05-26 Permutation Invariant Graph Generation via Score-Based Generative Modeling
2022-05-26 Adversarial Personalized Ranking for Recommendation
2022-05-26 Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks
2021-05-26 Categorical Reparameterization with Gumbel-Softmax
2021-05-26 Gumbel distribution
点击右上角即可分享
微信分享提示