Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System

Wei T., Feng F., Chen J., Wu Z., Yi J. and He X. Model-agnostic counterfactual reasoning for eliminating popularity bias in recommender system. In ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2021.

一篇非常传统的用因果解决 popular bias 的文章, 文中的术语可以借鉴一下.

符号说明

  • U={u1,u2,,un}, 用户;
  • I={i1,i2,,im}, items;
  • YRn×m, 交互矩阵, yui=1 若用户 u 和产品 i 发生过交互, 否则为 yui=0;

因果模型

以上(左)图为例, IK,Y 的共同祖先, 而 K 也是 Y 的祖先, 则我们可以用

Yi,k

来表示 do(I=i,K=k)Y 的一个情况 (虽然这个简单情形, 等价于条件概率, 还是用 do 以作区分).
当 仅 do(I=i) 时, 表示成 Yi=Yi,Ki.

  • 通常用 causal effect 来衡量前提 iY 的一个影响程度:

TE:=YiYi=Yi,KiYi,Ki.

i 可以理解是一个默认值.

  • 通常用 natural direct effect (NDE) 来衡量前提 iY 的一个直接影响 (而非通过 K):

NDE=Yi,KiYi,Ki.

  • 相应的, 有衡量主要经过 K 造成的间接影响 total indirect effect (TIE):

TIE=Yi,KiYi,Ki=TENDE.

主要内容

一般的推荐系统模型是通过用户 u 和产品 i 的一个匹配程度 y^k, 并以此为标准判断是否要进行推荐. 这种模式可以用上图的 (a) 来表示. 但是这种完全依赖匹配程度的预测是不准确的. 实际上:

  1. 对于两个功能相同的物品而言, 较为流行的那个往往更容易被用户所选择, 故产品 I 往往能够直接影响 Y, 即 IY;
  2. 对于不同的用户而言, 有些用户喜欢探索流行的产品, 而有些用户则不然, 所以用户本身也会对 Y 产生直接的影响, UY.

所以更合理的因果模型应当如图 (c) 所示.

为此, 作者设计了如下的一个框架:

训练

  1. Recommender 部分, 以 u,i 为输入得到二者的匹配程度 y^k;
  2. User 部分, 以 u 为输入得到预测 y^u;
  3. Item 部分, 以 i 为输入得到预测 y^i;
  4. 将上述三者进行一个融合, 得到

(1)y^ui=y^kσ(y^i)σ(y^u),

其中 σ 表示 Sigmoid.

  1. 训练 KY 的一个预测能力:

LO=(u,i)Dyuilog(σ(y^ui))(1yui)log(1σ(y^ui));

  1. 训练 UY 的一个预测能力:

LO=(u,i)Dyuilog(σ(y^u))(1yui)log(1σ(y^u));

  1. 训练 IY 的一个预测能力:

LO=(u,i)Dyuilog(σ(y^i))(1yui)log(1σ(y^i)).

注意到, 在融合的时候, (1) 中仅对 y^i,y^u 进行 σ() 处理, 作者说这是为了突出 y^k 的作用, 个人感觉这个显得不是那么的合理 (从概率角度).

推断

为了在推断的时候消除 I,U 本身引发的一些 bias, 作者希望通过 U,I 的一个 TIE 来进行预测, 即如下图 (b) 所示:

也可以用如下公式表示:

TIE=Yu,i,Ku,iYu,i,Ku,i=y^kσ(y^i)σ(y^u)cσ(y^i)σ(y^u),

这里 c 是需要待定的一个超参数. 通过 TIE 的大小可以进行推荐.

总结

  1. 本文提出的方法可以说是显式地构建了一个所谓的合理的因果模型;
  2. 但是如何保证 y^k 就是正确反映了二者匹配程度, 而不夹杂其它的 bias 呢?
posted @   馒头and花卷  阅读(305)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2021-06-14 SMOOTHING (LOWPASS) SPATIAL FILTERS
2021-06-14 Data Augmentation
2021-06-14 TriggerBN ++
点击右上角即可分享
微信分享提示