在RCT中,为了控制混杂,我们收集样本时采用较为严格的入排标准,使受试者的基线(可能的混杂)尽量相近

但是在真实世界研究中,往往事先无法控制这个因素,研究者们采用统计的方法,使得混杂得到控制。

常用的方法有以下几种:

1,分层分析

2,多因素分析

3,倾向性评分

4,工具变量分析

 

1,分层分析

顾名思义,将样本按照混杂因素分层,比如吸烟(暴露)对肺癌(结局)的影响

那么性别可能是一个混杂。所以,我们在计算OR、RR、HR或其他流行病学 指标/效应时,将样本分为两层

男性,女性,分别计算OR,(当男OR与女OR接近时,此处不做讨论)使用(Mantel-Haenszel)法合并OR

缺点:n个混杂,需要分2^n个层,要么使得样本量增大,要么有的分层下人数很少

 

2,多因素分析

统计学常用的model---logistic regression,他的偏回归系数的意思,就是在其他自变量不变的情况下, i自变量每增加一个单位,样本出现阳性结果是阴性结果的e^(βi)倍,

偏回归系数的意义,完美的说明了逻辑回归是如何控制混杂的。

缺点:混杂(协变量/自变量)增加,使得样本量增大(样本量为自变量个数的15倍)。

 

3,倾向性评分

使用逻辑回归,得到每个人阳性结果的概率P(y值),根据这个P,控制混杂

常用到

3.1 ,1:1配对,即将P接近的暴露与非暴露组中的受试者匹配。

3.2, 根据P值大小,将人群分若干组,进行分层分析。

3.3    将P作为协变量再次放入逻辑归回。  

不足:未能处理未知因素所引起的残余混杂

 

4,工具变量

关键在于工具变量的选择,根据工具变量得到的某一统计量将样本分层。要求工具变量与暴露因素相关,但是与结局无关

常用的工具变量

4.1  地区的医疗水平

4.2  医生的处方偏好

4.3  医疗机构的临床实践方式

4.4  时间特性的的工具变量

 

参考:https://www.mediecogroup.com/method_topic_article_detail/135/?ty=methods

 

posted on 2019-08-04 19:09  be·freedom  阅读(625)  评论(0编辑  收藏  举报