有序logit回归案例分析
我们经常会遇到因变量有多个取值而且有大小顺序的情况,如幸福感,开心程度等,这时,一般的线性回归分析无法准确地刻画变量之间的因果关系,需要用其他的回归分析方法来进行拟合模型,SPSSAU的有序logit回归分析便是一种简便的处理该类因变脸问题的分析方法。
此案例使用有序logit回归研究视力低下学生视力监测结果的情况。
一、案例背景
案例研究某省中学50名视力低下学生视力监测的结果数据。利用有序logit回归分析方法分析视力低下程度与年龄、性别之间的关系。部分数据如下:
自变量“性别”为定类变量所以需要进行哑变量处理。哑变量进行分析时需要少放入一项,作为参考项。
所以本次分析的操作截图如下:
二、检验说明
关于有序logit回归分为以下五个方面进行说明,其中包括接连函数的选择、平行性检验、模型似然比检验、参数估计分析以及模型预测效果分析。
1.接连函数的选择
SPSSAU提供5个接连函数,具体该如何选择请参考如上。
分析结果来源于SPSSAU上表所示参与调查者中“轻度近视”占比为30%,“中度近视”占比为48%,“高度近视”占比为22%,所以分布较为均匀并且选项个数只有3个较少,接连函数选择“logit”比较合适。接下来看一下平行性检验。
2.平行性检验
该结果对p值进行分析,如果该值大于0.05,则说明通过平行性检验,反之说明没有通过平行性检验,上表可知p值大于0.05,说明通过平行性检验,所以可以继续进行分析。进一步查看似然比检验。
3. 似然比检验
首先对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效;上表可以看出p值小于0.05所以说明模型有效,本次模型构建有意义。
4.结果分析
自变量“性别”为定类变量所以需要进行哑变量处理。哑变量进行分析时需要少放入一项,作为参考项。所以放入性别_男,首先查看p值,自变量性别_男p值<0.05并且回归系数为-2.343,其余分析项p值大于0.05,所以男性共1项会对视力低下程度产生显著的负向影响关系。但是年龄并不会对视力低下程度产生影响关系。
模型公式如下:
logit[P(视力低下程度<=中度近视)/(1-P(视力低下程度<=中度近视))]=4.917-2.343*性别_男+0.385*年龄
logit[P(视力低下程度<=轻度近视)/(1-P(视力低下程度<=轻度近视))]=6.718-2.343*性别_男+0.385*年龄
5.预测准确率
模型预测准确率表格,用于展现预测准确率情况,包括各个类别和整体的预测准确率。如果模型用于预测分析,则预测准确率非常重要,如果模型用于研究影响关系,则不太关注预测准确率值。
三、总结
本案例利用有序logit回归分析研究50名视力低下学生视力监测的结果数据。由于自变量中有定类变量,需要分析前需要进行哑变量处理,对于分析结果从5个方面进行说明,首先是接连函数的选择,其次是平行性检验,如果没有通过平行性检验可以改用多分类logit回归分析等。接着进行分析似然比检验,观察模型构建是否有效,然后对结果进行分析说明,最后对模型进行预测率进行评价,若主要目的是研究影响关系,该项不用过度关注。