Direct and Indirect Effects
概
CDE: Controlled Direct Effect;
NDE: Natural Direct Effect;
NIE: Natural Indirect Effect.
TDE: Total Direct Effect;
TIE: Total Indirect Effect;
PDE: Pure Direct Effect;
PIE: Pure Indirect Effect.
主要内容
graph LR
X(X) -->Z(Z) --> Y(Y)
X --> Y
设想, 药物\(X\)的影响通过俩种途径:
- 直接对身体产生的影响;
- 服用药物\(X\)会导致头疼, 故患者大概率会服用镇痛剂, 镇痛剂会利于(或者不利于)恢复.
如果我们直接计算causal effect, 则二者都会纳入其中, 但是往往我们所关心的只是单纯的\(X \rightarrow Y\)这一部分, 也即direct effect, 那么如何计算呢?
CDE
average CDE的计算是:
\[\mathbb{E}[Y|do(X=x), do(Z=z)]
-\mathbb{E}[Y|do(X=x^*), do(Z=z)],
\]
之所以被称之为controlled direct effect, 是因为我们认为的限定\(Z=z\).
用上面的例子来说就是, 我们限定所有人服用的镇定剂为\(z\).
NDE
average NDE的计算是:
\[\mathbb{E}[Y|do(X=x), do(Z=Z_{x*})]
-\mathbb{E}[Y|do(X=x^*)],
\]
相当于, 一个人服用了药物\(x\), 但是我们骗他说服用了药物\(x^*\), 导致其服用镇定剂的量是本应该服用药物\(x^*\)后的量.
不同于CDE, NDE的计算要略微复杂一点:
需要满足:
\[Y_{xz} \amalg Z_{x^*} | W,
\]
这里\(W\)是confounder.
此时:
\[NDE(x, x^*, Y) = \sum_{w, z}[\mathbb{E}[Y_{x,z}|w] - \mathbb{E}[Y_{x^*,z}|w]]P(Z_{x^*}=z|w)P(w).
\]
NIE
有些时候我们想要的是支线\(X \rightarrow Z \rightarrow Y\), 此时我们需要计算NIE:
average NIE的计算是
\[\mathbb{E}[Y|do(X=x^*), do(Z=Z_{x})]
-\mathbb{E}[Y|do(X=x^*)].
\]
类似的解释.
满足
\[Y_{x^*, z} \amalg Z_x | W,
\]
可以得到
\[NIE(x, x^*, Y) = \sum_{w, z}\mathbb{E}[Y_{x^*,z}|w][P(Z_{x}=z|w) - P(Z_{x^*}=z|w)]P(w).
\]
TDE, TIE, PDE, PIE
可以发现:
\[\begin{array}{rl}
\mathbb{E}[Y_{x}]
-\mathbb{E}[Y_{x^*}]
&=\mathbb{E}[Y_{xZ_x}]
-\mathbb{E}[Y_{x^*Z_{x^*}}] \\
&=\underbrace{(\mathbb{E}[Y_{xZ_x}]-\mathbb{E}[Y_{xZ_{x^*}}])}_{TIE} +
\underbrace{(\mathbb{E}[Y_{xZ_{x^*}}]-\mathbb{E}[Y_{x^*Z_{x^*}}])}_{PDE}\\
&=\underbrace{(\mathbb{E}[Y_{xZ_x}]-\mathbb{E}[Y_{x^*Z_x}]])}_{TDE} +
\underbrace{(\mathbb{E}[Y_{x^*Z_x}]-\mathbb{E}[Y_{x^*Z_{x^*}}])}_{PIE}.
\end{array}
\]
PDE = NDE, PIE = NIE.