How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective
概
本文分析在不引入额外的约束下, 基于矩阵分解的模型倾向于匹配 item 的流行度.
符号说明
- , user set, ;
- , item set, ;
- , interaction matrix;
- , 表示 item 的交互频率, 总的构成流行度向量 (popularity vector) .
Popularity bias
-
我们考虑基于矩阵分解的方法, 它提供:
用以计算 user 和 item 之间的相似度
这里 表示激活函数.
-
令 表示 user, item 的向量矩阵, 可得
-
对预估的得分矩阵 进行 SVD 分解:
且 .
和 具有高相似度
-
上图展示了 (1) 中的主(右)奇异向量 和 popularity vector 的 cosine 相似度:
非常接近 1. 因此, 我们可以认为, 传统模型所学到的得分矩阵 其实受到了非常非常多的流行度的影响.
-
进一步地, 我们可以理论证明这一点:
-
Theoerm 1 (Popularity memorization effect): 给定一个 embedding-based 的模型且具备足够的表达能力, 当 服从 power-law, 我们有:
其中 , 表示 Riemann zeta function .
proof:
-
注意, 这里假设模型有足够的表达能力, 即假设 能够足够近似 , 于是后面的分析相当于都是基于 的 SVD 分解之上.
-
于是
-
又
-
于是
-
后续需要 bound 和 , 需要更多的符号引入 (详情请回看原文).
相似度随着维度降低而增加
- 这个其实是比较显然, 因为维度降低总的能量降低了.
相似度随着训练的变化
- 随着训练进行, popularity bias 的影响是逐步降低的, 但是过低实际上会导致效果的下降, 这似乎说明了 popularity bias 的需要维持在一定程度, 过低或这过高都不太好.
ReSN: Regulartion with Spectral Norm
-
本文提出的方法是:
这里 是谱范数.
-
但是这个计算是复杂的, 因此用如下的替代
相当于, 我们要求最后得到 score matrix 和流行度向量
的匹配度不能太高 (根据证明, 是比较接近 的).
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix