【因果推断】中介因果效应分解 汇总与理解

中介因果效应分解 汇总与理解

1. 前言

在学习因果推断相关文章时[4,5],对总体因果效应如何分解为直接效应和间接效应产生了一些困惑,查阅相关资料[1,2,3]后,将因果效应分解的相关概念汇总形成此文,希望帮助有需要的同学理清概念,加深理解。

关于因果推断更基础的知识请参考相关书籍[6,7]。

2. 问题描述

中介效应,是指在因果模型中,Treatment X 对Outcome Y的因果效应可能有一部分是通过中介变量M(Mediation)传递过去的。例如:

Figure 1

在这种因果模型中,我们感兴趣的问题是,X对Y的因果效应中,有多大比例是通过M传递过去的?

  • 中介效应分析对于政策制定[1]、理解数据[8]都有重要作用。
  • 例如
    • 药物(X)对病情(Y)的影响有多少是通过阿司匹林剂量(M)造成的?药物(X)通过直接路径有多大效果?如果副作用被消除,药物的效果会受到多大影响?[1]
    • 不同国家(X)之间新冠死亡率的差异(Y)有多少是由于患者年龄分布(M)造成的?[8]

3. 符号定义

X=xM=m时,Y的取值记为Yxm

X=x时,M的取值记为Mx

简单起见,假设X是二元变量,例如:

  • X=1,MX=1时M的值时,Y的取值记为Y1M1
  • X=1,MX=0时M的值时,Y的取值记为Y1M0

在很多论文中,也将X=1记为X=x,将X=0记为X=x,对应的,M1记为m,M0记为m,则Y1M1记为YxmY1M0记为Yxm

4. 总体效应、直接效应与间接效应

以下以第二部分叙述过的药物和阿司匹林的例子[1]来说明各个效应的含义。

总体效应(Total Effect, TE):

(1)TE=E[Y1]E[Y0]=E[Y1M1]E[Y0M0]

  • 服用药物对病情缓解整体上有多大作用?

控制直接效应(Controlled Direct Effect, CDE):

(2)CDE=E[Y1m]E[Y0m]

  • 如果在服用药物时,嘱咐患者将阿司匹林用量调整到m,则药物会有多大作用?
    • 注意这里的m是人为定义的,既不是服药前的自然用量,也不是服药后的自然用量,相当于do(M=m)
    • 由于控制变量——阿司匹林用量是被人为控制的,不是自然的,且衡量的是直接路径的影响(控制了中介变量为m),因此称为“控制直接效应”。

自然直接效应(Natural Direct Effect, NDE or Pure Direct Effect, PDE):

(3)NDE=PDE=E[Y1M0]E[Y0M0]

  • 如果病人在服用药物的同时,保持阿司匹林服用量不变(不因为药物副作用而改变阿司匹林用量),则药物会有多大效果?
    • 保持阿司匹林的服用量和服药之前一致,这个用量对于不同患者来说是不同的——患者由于基础疾病和身体情况不同,有各自不同的用药习惯。
    • 由于控制变量——阿司匹林用量是“自然”的,且衡量的是直接路径的影响(控制了中介变量为M0),因此称为“自然直接效应”。

自然间接效应(Natural Indirect Effect, NIE or Pure Indirect Effect, PIE):

(4)NIE=PIE=E[Y0M1]E[Y0M0]

  • 如果病人不服药,但是将阿司匹林用量调整到服药后的量,病情会有多大程度的缓解?
    • 只调整阿司匹林的量,估计通过间接路径产生的因果效应。
    • 由于控制变量——不服药是“自然”的,且衡量的是间接路径的影响(控制了服药量为0),因此称为“自然间接效应”

总体直接效应(Total Direct Effect, TDE)

(5)TDE=E[Y1M1]E[Y0M1]

  • 服药且改变阿司匹林用量,与只改变阿司匹林用量相比,治疗效果有多大提升?
    • 控制阿司匹林用量都是服药后的量,比较服药和不服药的区别。
    • 控制变量——阿司匹林用量是服药后的自然服用量(包含了服药的影响),且衡量的是直接路径的影响(控制了中介变量为M1),因此称为“总体直接效应”。

总体间接效应(Total Indirect Effect, TIE)

(6)TIE=E[Y1M1]E[Y1M0]

  • 在服药的条件下,因为副作用而增加阿司匹林用量对治疗效果有影响吗?
    • 控制变量——服药量为1(不是自然情况,自然情况应该是0),衡量的是间接路径的影响,称为“总体间接效应”。

5. 总体效应的分解

总体效应TE可以被分解为直接效应和间接效应[1,2],或分解为直接效应、间接效应和交互效应[3]。[9]

(7)E[Y1]E[Y0]=E[Y1M1]E[Y0M0]=(E[Y1M1]E[Y0M1])TDE+(E[Y0M1]E[Y0M0])PIE/NIE=(E[Y1M1]E[Y1M0])TIE+(E[Y1M0]E[Y0M0])PDE/NDE=[(E[Y1M1]E[Y1M0])TIE(E[Y0M1]E[Y0M0])PIE/NIE]+(E[Y1M0]E[Y0M0])PDE/NDE+(E[Y0M1]E[Y0M0])PIE/NIE

分析[(E[Y1M1]E[Y1M0])TIE(E[Y0M1]E[Y0M0])PIE/NIE]这一项:

  • 如果M1 = M0,则此项为0,且总体间接效应和自然间接效应都为0——中介变量不带变的,就没有间接效应了。
  • 如果M1=1,M0=0,则

(8)(M1M0)=1(E[Y1M1]E[Y1M0])(E[Y0M1]E[Y0M0])=(E[Y11]E[Y10]E[Y01]+E[Y00])(M1M0)

  • 如果M1=0,M0=1,则

(9)(M1M0)=1(E[Y1M1]E[Y1M0])(E[Y0M1]E[Y0M0])=(E[Y11]+E[Y10]+E[Y01]E[Y00])=(E[Y11]E[Y10]E[Y01]+E[Y00])(M1M0)

因此,(7)式可进一步推导为:

(10)E[Y1]E[Y0]TE=E[Y1M1]E[Y0M0]TE=(E[Y1M1]E[Y0M1])TDE+(E[Y0M1]E[Y0M0])PIE/NIE=(E[Y1M1]E[Y1M0])TIE+(E[Y1M0]E[Y0M0])PDE/NDE=[(E[Y1M1]E[Y1M0])TIE(E[Y0M1]E[Y0M0])PIE/NIE]+(E[Y1M0]E[Y0M0])PDE/NDE+(E[Y0M1]E[Y0M0])PIE/NIE=(E[Y1M0]E[Y0M0])PDE/NDE+(E[Y0M1]E[Y0M0])PIE/NIE+(E[Y11]E[Y10]E[Y01]+E[Y00])(M1M0)Interactive Effects

至此,我们得到了非线性模型总体效应的分解方法:

  • 分解为直接效应和间接效应[1],有总体直接效应+自然间接效应自然直接效应+总体间接效应两种。
  • 分解为直接效应、间接效应和交互效应[3],则是自然直接效应+自然间接效应+交互效应

如果是线性模型,则交互效应为0,NDE=TDE,NIE=TIE。[1,2,3]

参考文献

[1] J. Pearl, “Direct and indirect effects,” in Proc. 17th Conf. Uncertainty Artif. Intell., 2001, pp. 411–420

[2] Robins J M, Greenland S. Identifiability and exchangeability for direct and indirect effects[J]. Epidemiology, 1992: 143-155.

[3] VanderWeele T J. A three-way decomposition of a total effect into direct, indirect, and interactive effects[J]. Epidemiology (Cambridge, Mass.), 2013, 24(2): 224.

[4] Wang W, Feng F, He X, et al. Clicks can be cheating: Counterfactual recommendation for mitigating clickbait issue[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 1288-1297.

[5] Wei T, Feng F, Chen J, et al. Model-agnostic counterfactual reasoning for eliminating popularity bias in recommender system[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 1791-1800.

[6] Pearl J, Glymour M, Jewell N P. Causal inference in statistics: A primer[M]. John Wiley & Sons, 2016.

[7] Imbens G W, Rubin D B. Causal inference in statistics, social, and biomedical sciences[M]. Cambridge University Press, 2015.

[8] von Kügelgen J, Gresele L, Schölkopf B. Simpson's paradox in Covid-19 case fatality rates: a mediation analysis of age-related causal effects[J]. IEEE Transactions on Artificial Intelligence, 2021, 2(1): 18-27.

[9] Direct and Indirect Effects 馒头and花卷 博客园 https://www.cnblogs.com/MTandHJ/p/14615052.html

posted @   子豪君  阅读(5870)  评论(2编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示