Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System
概
一篇非常传统的用因果解决 popular bias 的文章, 文中的术语可以借鉴一下.
符号说明
- , 用户;
- , items;
- , 交互矩阵, 若用户 和产品 发生过交互, 否则为 ;
因果模型
以上(左)图为例, 是 的共同祖先, 而 也是 的祖先, 则我们可以用
来表示 下 的一个情况 (虽然这个简单情形, 等价于条件概率, 还是用 以作区分).
当 仅 时, 表示成 .
- 通常用 causal effect 来衡量前提 对 的一个影响程度:
可以理解是一个默认值.
- 通常用 natural direct effect (NDE) 来衡量前提 对 的一个直接影响 (而非通过 ):
- 相应的, 有衡量主要经过 造成的间接影响 total indirect effect (TIE):
主要内容
一般的推荐系统模型是通过用户 和产品 的一个匹配程度 , 并以此为标准判断是否要进行推荐. 这种模式可以用上图的 (a) 来表示. 但是这种完全依赖匹配程度的预测是不准确的. 实际上:
- 对于两个功能相同的物品而言, 较为流行的那个往往更容易被用户所选择, 故产品 往往能够直接影响 , 即 ;
- 对于不同的用户而言, 有些用户喜欢探索流行的产品, 而有些用户则不然, 所以用户本身也会对 产生直接的影响, .
所以更合理的因果模型应当如图 (c) 所示.
为此, 作者设计了如下的一个框架:
训练
- Recommender 部分, 以 为输入得到二者的匹配程度 ;
- User 部分, 以 为输入得到预测 ;
- Item 部分, 以 为输入得到预测 ;
- 将上述三者进行一个融合, 得到
其中 表示 Sigmoid.
- 训练 的一个预测能力:
- 训练 的一个预测能力:
- 训练 的一个预测能力:
注意到, 在融合的时候, (1) 中仅对 进行 处理, 作者说这是为了突出 的作用, 个人感觉这个显得不是那么的合理 (从概率角度).
推断
为了在推断的时候消除 本身引发的一些 bias, 作者希望通过 的一个 TIE 来进行预测, 即如下图 (b) 所示:
也可以用如下公式表示:
这里 是需要待定的一个超参数. 通过 的大小可以进行推荐.
总结
- 本文提出的方法可以说是显式地构建了一个所谓的合理的因果模型;
- 但是如何保证 就是正确反映了二者匹配程度, 而不夹杂其它的 bias 呢?
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2021-06-14 SMOOTHING (LOWPASS) SPATIAL FILTERS
2021-06-14 Data Augmentation
2021-06-14 TriggerBN ++