Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations
概
本文介绍了一种推荐大模型的框架的训练方法.
GRs (Generative Recommenders)
任务形式
- 如上图所示, DRs 这里把 E/F, G, H 分别进行 merge and sequentialize, 这里 (E, F) 表示哪些用户的交互行为, merge 后得到的是 : (Context, action, timestamp), 二 G, H 则是一些 "not related to user-content engagements".
-
对于 ranking, 作者设计的任务是:
即通过过往的信息预测下一个 action.
-
对于 retrieval, 作者设计的任务是仅对那些 为 positive 的情况进行:
negative 的 action 不进行预测.
模型设计
- 作者为了兼顾效率, 特别改进了模型框架:
- 注意到, 其中的每个模块变成了:
o
- 虽然形式上和 attention 还是比较像的, 但是注意到:
- 并没有经过 softmax 处理, 作者认为这样除了效率外, 还能够保证不同的参与度能够有所区分;
- , 门控机制的引入 (作者用来模拟 MoE).
-
可以发现, softmax 这个点的影响很大.
-
此外, 还有数据集的切分, 优化器的选择等等.
虽然最后的效果并没有特别夸张, 但是这些尝试是值得肯定的.
代码
[official]
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2023-05-26 STAMP: Short-Term Attention Memory Priority Model for Session-based Recommendation
2023-05-26 Permutation Invariant Graph Generation via Score-Based Generative Modeling
2022-05-26 Adversarial Personalized Ranking for Recommendation
2022-05-26 Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks
2021-05-26 Categorical Reparameterization with Gumbel-Softmax
2021-05-26 Gumbel distribution