用反事实推理缓解数据流行度偏差《Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in RS》

背景

在推荐场景,广泛存在长尾分布的现象,即少量的物品频繁的出现,导致正常训练的推荐模型更倾向于推荐流行物品,从而导致马太效应,即流行的物品被更频繁地推荐,并变得更加流行。目前针对这个问题的去偏算法主要可以分成三类:

(1)逆权重分数:估计物品流行度的倾向性权重,并对每条数据样本利用逆权重分数进行加权。

(2)加入无偏数据:通过从额外的无偏数据中学习来纠正流行度偏差。

(3)分解嵌入表示:将兴趣和流行度分解为两套嵌入模型,并调整使得模型学习到更鲁棒的模式。

这篇论文引入了因果推断的思想来对模型进行纠偏

 

模型结构

论文提出上图所示的模型结构,模型主要包含3个head:

 

 

损失函数

 

最终的预测结果

 

参考资料

https://mp.weixin.qq.com/s/b1DCPuO-yzR4oZpzx3xVfg

https://zhuanlan.zhihu.com/p/447760259

https://mp.weixin.qq.com/s/dbI8p5szlHaoOcL9cdVpkg

posted @ 2022-11-15 20:45  xd_xumaomao  阅读(278)  评论(0编辑  收藏  举报