医学案例|单因素方差分析

一、案例介绍
为研究郁金对低张性缺氧小鼠存活时间的影响,将36只小鼠随机生成A、B以及 C 三组,,每组12个,雌雄各半,分别以10g/kg、20g/kg、40g/kg三种不同剂量的郁金灌胃,各组小鼠均同时置于放有钠石灰的250ml密闭广口瓶中,观察并记录小鼠存活时间。想要研究不同剂量的郁金下的小鼠的存活时间是否不同(案例数据来源于:颜虹, 徐勇勇. 医学统计学[J]. 人民卫生出版社, 2015.)。
二、问题分析
想要分析用三种不同剂量的郁金灌胃,小鼠存活时间是否有差异,差异性分析常见的方法包括方差分析,t检验,卡方检验,由于“组别”是定类数据,“存活时间”是定量数据,卡方检验中的自变量和因变量均需要满足定类变量,所以使用方差分析或者t检验,又因为定类数据的组别为三个分别为“A组”、“B组”以及“C组”,一般两个以上组别需要使用方差分析。所以本例子中使用方差分析进行研究。方差分析包括单因素方差分析和多因素方差分析,因为自变量只有一个(“组别”),所以使用单因素方差分析进行研究即可。
三、软件操作及结果解读
(一) 数据导入
1.数据格式
首先将数据整理成正确的格式,一般X一列,Y为一例,并且分析的数据带有数据标签的,需要另添加一个表格进行说明,数据格式如下:
添加图片注释,不超过 140 字(可选)
2.导入数据
将整理好的数据上传至SPSSAU系统内,如下:
添加图片注释,不超过 140 字(可选)
上传结果如下:
添加图片注释,不超过 140 字(可选)
(二) 适用条件判断
1.适用条件
首先对数据进行简单查看,比如是否含有异常值等,异常值的存在可能会影响分析结果,所以在分析前需要进行处理,除此之外,进行方差分析还需要满足每个总体服从正态分布,各个总体的方差相同(满足方差齐性),以及观测值是独立的(例子已满足)。所以以下一一来检验异常值、方差齐以及正态性。
2. 适用条件判断
(1)异常值
检查数据中的异常值,异常值顾名思义就是同一组别中与其他的值相比相差特别大(比如大于3倍标准差等),异常值的存在会使整体的均值和标准差不准确,可能会导致最终的结果分析不准确,检查异常值的方法有很多,包括利用描述分析进行查看标准差在进行判断,散点图以及箱线图等,其中图示化方法比较直观,所以这里利用SPSSAU可视化的箱线图进行描述,操作如下:
添加图片注释,不超过 140 字(可选)
结果如下:
添加图片注释,不超过 140 字(可选)
从上图结果可以看出,A组数据、B组数据以及C组数据均没有异常值。所以无需处理。接下来检验数据的方差齐性。
(2)方差齐性
SPSSAU方差齐性的操作如下:
添加图片注释,不超过 140 字(可选)
结果如下:
添加图片注释,不超过 140 字(可选)
从结果中可以看出,三个组别进行方差齐检验,最终F值为2.772,p值为0.764大于0.05,意味着三组数据波动没有太大差异,具有方差齐性。满足分析条件,接下来进行正态性检验。
(3)正态性检验
正态分布的检验方法有很多种,包括正态性检验以及图示法p-p图,q-q图等,一般图示化比较直观,所以使用直方图进行查看,结果如下:
添加图片注释,不超过 140 字(可选)
发现“存活时间”呈现倒扣的钟形,所以满足正态性分布标准,数据满足方差分析的前提条件,可直接进行单因素方差分析。
(三)单因素方差分析
  1. 软件操作 上传数据后点击【通用方法】→【方差分析】然后进行分析:
添加图片注释,不超过 140 字(可选)
  1. 结果解读
(1)模型结果
分析三种不同剂量的郁金灌胃,小鼠存活时间是否有差异,以“组别”为自变量,以“存活时间”作为因变量进行单因素方差分析,结果如下:
添加图片注释,不超过 140 字(可选)
从上表中可以看出,A组的均值为40.08,标准差为5.79;B组的均值为52.96,标准差为5.01;C组的均值为74.19,标准差为6.42。从中可以看出三者之间有差异,并且C组的小鼠存活时间相对更长,以及单因素方差模型的F值为106.968,P值远小于0.05,具有显著性差异,也说明了三者之间存在显著性差异。也可以用图示化方法进行描述三者的均值对比:
添加图片注释,不超过 140 字(可选)
从折线图中可以看出,例子中“C组”的均值最大,其次是“B组”最后是“A组”也即说明“C组”的小鼠存活时间较长,然后是“B组”最后是“A组”。那么根据单因素方差分析验证三者之间存在显著性差异,具体指标是如何计算的呢?
(2)指标计算
SPSSAU单因素方差分析默认有提供中介值计算:
添加图片注释,不超过 140 字(可选)
01自由度
组间自由度df1=组别数-1=3-1=2;组内自由度df2=样本量-组别数量=12*2-3=33;
02均方
组间均方=组间平方和/组间自由度df1=7119.994/2=3559.997;
组内均方=组内平方和/组内自由度df2=1098.275/33=33.281;
03 F值
F值=组间均方/组内均方=3559.997/33.281=106.968;
04 p值
F值为统计量,p值结合F值和自由度计算得到。
四、结论
通过实验数据进行单因素方差分析发现三个组别之间的小鼠存活时间是否有差异,结合单因素方差分析结果以及折线图发现“C组”小鼠存活时间最长,也即说明郁金对低张性缺氧小鼠存活时间有影响,并且在实验中40g/kg郁金剂量的小鼠存活时间比10g/kg郁金剂量和20g/kg郁金剂量更长。其次是20g/kg郁金剂量小鼠的存活时间,最后是10g/kg郁金剂量小数的存活时间。
五、知识小贴士
1、方差不齐时如何办?
方差不齐时可使用‘非参数检验’,同时还可使用welch 方差,或者Brown-Forsythe方差,非参数检验是避开方差齐问题;而welch方差或Brown-Forsythe方差是直面方差齐,即使在方差不齐时也保证结果比较稳健,welch方差和Brown-Forsythe方差仅在计算公式上不一致,目的均是让方差不齐时结果也稳健,选择其中一种即可。
2、方差分析是否需要满足正态性?
从理论上讲,方差分析有两个前提条件,一是因变量Y需要满足正态性要求,二是满足方差齐检验。如果不满足,此时可使用【通用方法->非参数检验】进行研究差异性。也有文献提及可将数据进行转换后使其更加接近或符合正态性,然后继续使用方差分析,用户可尝试进行数据转换【数据处理->生成变量】功能,一般是对数据进行比如求对数,开根号等处理。理论上的正态分布并不存在,数据接近于正态分布更符合实际情况,因此接近正态分布的数据直接使用方差分析即可。
posted @ 2023-06-29 10:40  spssau  阅读(160)  评论(0编辑  收藏  举报