控制混杂-有感

在RCT中，为了控制混杂，我们收集样本时采用较为严格的入排标准，使受试者的基线（可能的混杂）尽量相近

但是在真实世界研究中，往往事先无法控制这个因素，研究者们采用统计的方法，使得混杂得到控制。

常用的方法有以下几种：

1，分层分析

2，多因素分析

3，倾向性评分

4，工具变量分析

1，分层分析

顾名思义，将样本按照混杂因素分层，比如吸烟（暴露）对肺癌（结局）的影响

那么性别可能是一个混杂。所以，我们在计算OR、RR、HR或其他流行病学指标/效应时，将样本分为两层

男性，女性，分别计算OR，（当男OR与女OR接近时，此处不做讨论）使用（Mantel-Haenszel）法合并OR

缺点：n个混杂，需要分2^n个层，要么使得样本量增大，要么有的分层下人数很少

2，多因素分析

统计学常用的model---logistic regression，他的偏回归系数的意思，就是在其他自变量不变的情况下， i自变量每增加一个单位，样本出现阳性结果是阴性结果的e^(β_i)倍，

偏回归系数的意义，完美的说明了逻辑回归是如何控制混杂的。

缺点：混杂（协变量/自变量）增加，使得样本量增大（样本量为自变量个数的15倍）。

3，倾向性评分

使用逻辑回归，得到每个人阳性结果的概率P（y值），根据这个P，控制混杂

常用到

3.1 ，1：1配对，即将P接近的暴露与非暴露组中的受试者匹配。

3.2，根据P值大小，将人群分若干组，进行分层分析。

3.3 将P作为协变量再次放入逻辑归回。　　

不足：未能处理未知因素所引起的残余混杂

4，工具变量

关键在于工具变量的选择，根据工具变量得到的某一统计量将样本分层。要求工具变量与暴露因素相关，但是与结局无关

常用的工具变量

4.1 地区的医疗水平

4.2 医生的处方偏好

4.3 医疗机构的临床实践方式

4.4 时间特性的的工具变量

posted on 2019-08-04 19:09 be·freedom 阅读(706) 评论(0) 收藏举报