An Attentive Inductive Bias for Sequential Recommendation beyond the Self-Attention

Shin Y., Choi J., Wi H. and Park N. An attentive inductive bias for sequential recommendation beyond the self-attention. AAAI, 2024.

本文在 attention block 中引入高低频滤波.

符号说明

  • U, users;

  • V, items;

  • Su=[v1u,v2u,,v|Su|u], sequence;

  • ESuRL×d, sequence embeddings;

  • attention matrix:

    A=softmax(QKTd),Q=ESuWQ,K=ESuWK.

  • fj=[e2πi(j1)0,,e2πi(j1)(N1)]T/NRN, 维 DFT (Discrete Fourier Transform) 的第 j 个基底, 这里 i 表示 imaginary unit.

BSARec (Beyond Self-Attention for Sequential Recommendation)

  • 首先, 作者对一般的序列推荐模型如 SASRec, FMLPRec 的演进过程中的 embedding 的奇异值变化和 user embedding 的 cosine similarity 进行比较, 可以发现 embedding 主特征值的主导地位相当明显, 而且随着层数的加深, 越发变得相似. 故而, 作者得出结论, 认为现在的主流的序列推荐模型主要是在学习一个 low-pass 的滤波.

  • 令 DFT 的基底矩阵为 F, 对于任意的向量 x 我们可以得到它的频域上的表示

    x¯=Fx.

    并令 x¯lfcCc 表示 x¯ 的最低频位置的 c 个元素, x¯hfcCdc 表示 x¯ 的最高频位置的 dc 个元素.

  • 由此, 我们可以通过 Inverse DFT 得到

    • x 的低频信号:

      LFC[x]=[f1,f2,,fc]x¯lfcRd.

    • x 的高频信号:

      HFC[x]=[fc+1,fc+2,,fd]x¯hfcRd.

  • X 表示第 l 层的输入, 则 attention 后的结果为

    αAIBX+(1α)AX.

    其中 AX 对应正常的 attention 机制, 而 AIBX

    AIBX=LFC[X]+βHFC[X],

    其中 β 是可训练的参数, 它可以是每个维度设置一个, 也可以不同维度共享一个 (代码里的是这种方案).

代码

[official]

posted @   馒头and花卷  阅读(119)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2023-07-07 Memory Augmented Graph Neural Networks for Sequential Recommendation
2022-07-07 A Framework for Understanding Sources of Harm throughout the Machine Learning Life Cycle
点击右上角即可分享
微信分享提示