条件Logistic回归案例说明

在医学研究中，为了控制一些重要的混杂因素，经常会把病例和对照按年龄，性别等条件进行配对，形成多个匹配组。各匹配组的病例数和对照人数是任意的，比如一个病例和若干个对照匹配即1：1，在医学上称作“1:1病历对照研究”，常见还有1:M(M <=3)，即1个病例和1或2或3个对照匹配。

病历对照研究或者倾向得分匹配研究（一种将研究数据处理成‘随机对照实验数据’的方法）中常使用条件Logistic回归进行分析。其与普通的二元logistic回归区别在于，多出配对ID，即将配对组纳入考虑范畴。

1、案例背景

某北方城市研究喉癌发病的危险因素，使用1:2匹配的病例对照研究方法进行调查。共有25对配对数据（每对3个，即25*3=75行数据）。现研究两个影响因素分别是：是否吸烟和是否有癌症家族史。数据格式（部分）如下表：

提示：

条件logistic回归时，数据中一定需要记录配对编号，比如1:2的配对（1个病例配对2个对照，且共有20个组，组别编号从1到20，那么同时会有3个1，3个2，3个3，类似下去），而且在分析时将配对编号放入对应框中。

配对编号ID：共有25对配对，编号从1~25，每个数字会重复3次（分别对应病例或对照组）；

Y是否患喉癌：数字1表示病例组即患喉癌，数字0表示对照组即没有患喉癌；

X1是否吸烟：数字1表示吸烟，数字0表示不吸烟；

X2癌症家族史：数字1表示有家族患喉癌史，数字0表示没有家族患喉癌史。

在做条件logistic回归时，因变量只能为0和1二分类数据。数字中只能包括0和1，如果不是，可使用[数据处理]->[数据编码]进行设置。

2、操作

本例子操作截图如下：

3、结果分析

SPSSAU共输出三个表格，分别是：“条件logit回归模型似然比检验结果”，“条件logit回归模型分析结果汇总”，“条件logit回归模型分析结果汇总”。

① 第一个表格：条件logit回归模型似然比检验结果

模型似然比检验，用于分析模型是否有效；

在分析上，首先需要模型通过似然比检验，其原定假设为不加入X和加入X模型无明显差异，如果对应的p值小于0.05，意味着拒绝原假设，也即说明模型有意义。

从上表可知：此处模型检验的原定假设为：是否放入自变量(X1是否吸烟, X2癌症家族史)两种情况时模型质量均一样；从上表可知，模型拒绝原定假设(chi=6.319，p=0.042 <0.05)，即说明本次构建模型时，放入的自变量具有有效性，本次模型构建有意义。

② 第二个表格：条件logit回归模型分析结果汇总

包括模型的回归系数，R方值等数据；

从上表可知：模型McFadden R方值为0.115，意味着是否吸烟, 癌症家族史共2项可解释是否患喉癌的11.5%原因。

具体来看：X1是否吸烟的回归系数值为1.243，并且呈现出0.05水平的显著性(z=2.322，p=0.020 <0.05)，意味着X1是否吸烟会对Y是否患喉癌产生显著的正向影响关系。以及 (RR值，exp(b)值)为3.465(95% CI:1.214~9.892)，意味着相对不吸烟群体，吸烟群体患喉癌的风险倍数会加大3.465倍。

X2癌症家族史的回归系数值为-0.184，但是并没有呈现出显著性(z=-0.365，p=0.715>0.05)，意味着是否有癌症家族史并不会对患喉癌产生影响。

4、总结

分析过程涉及以下几个关键点：

（1）条件logistic回归时，数据中一定需要记录下配对编号，比如1:2的配对（1个病例配对2个对照，且共有20个组，组别编号从1到20，那么同时会有3个1，3个2，3个3，类似下去），而且在分析时将配对编号放入对应框中。

（2）条件logistic回归时，因变量只能为0和1二分类数据，数字中只能包括0和1，如果不是，可使用数据处理->数据编码进行设置。

「更多内容登录SPSSAU官网了解」

posted @ 2020-10-20 16:01 spssau 阅读(5055) 评论(0) 收藏举报

刷新页面返回顶部

spssau

条件Logistic回归案例说明

1、案例背景

2、操作

3、结果分析

4、总结

公告