用反事实推理缓解数据流行度偏差《Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in RS》

背景

在推荐场景，广泛存在长尾分布的现象，即少量的物品频繁的出现，导致正常训练的推荐模型更倾向于推荐流行物品，从而导致马太效应，即流行的物品被更频繁地推荐，并变得更加流行。目前针对这个问题的去偏算法主要可以分成三类：

（1）逆权重分数：估计物品流行度的倾向性权重，并对每条数据样本利用逆权重分数进行加权。

（2）加入无偏数据：通过从额外的无偏数据中学习来纠正流行度偏差。

（3）分解嵌入表示：将兴趣和流行度分解为两套嵌入模型，并调整使得模型学习到更鲁棒的模式。

这篇论文引入了因果推断的思想来对模型进行纠偏

模型结构

论文提出上图所示的模型结构，模型主要包含3个head：

损失函数

最终的预测结果

参考资料

https://mp.weixin.qq.com/s/b1DCPuO-yzR4oZpzx3xVfg

https://zhuanlan.zhihu.com/p/447760259

https://mp.weixin.qq.com/s/dbI8p5szlHaoOcL9cdVpkg

posted @ 2022-11-15 20:45 xd_xumaomao 阅读(411) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 《Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations》论文阅读

· Twitter延迟转化论文《Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction》阅读

· Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System

· 因果推断在推荐系统debias的应用

· Disentangling User Interest and Conformity for Recommendation with Causal Embedding论文笔记

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

历史上的今天：
2019-11-15 Linux文件目录命名规则
2019-11-15 Linux根文件系统详解

公告

昵称： xd_xumaomao
园龄： 5年9个月
粉丝： 1
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

推荐排行榜

最新评论

1. Re:Weighted LR （WCE Weighted cross entropy）
@gxxxxxxl 是的，第三行最右边是y'...
--xd_xumaomao
2. Re:Weighted LR （WCE Weighted cross entropy）
倒数第二张图的公式推导有问题吧，第三行的 y' 就开始少了，对吗？
--gxxxxxxl
3. Re:ListNet和ListMLE
@葡萄和咖啡是的，不小心写错了，感谢指正...
--xd_xumaomao
4. Re:ListNet和ListMLE
博主你好，请问你的例子里面是不是应该是三个排列的概率相乘而非相加呢？
--葡萄和咖啡
5. Re:对比学习《Self-supervised Learning for Large-scale Item Recommendations》
@dddddddddsdf 按论文说的，应该是先按互信息把特征分成两个集合：集合1和集合2，样本1是mask集合1中的特征+dropout得到的，样本2时mask集合2中的特征+dropout得到的，...
--xd_xumaomao