如何做方差分析?
方差分析是在20世纪年代发展起来的一种统计方法,它是由英国统计学家费希尔在进行试验设计时为解释试验数据而首先引入的,根据所分析的自变量多少,方差分析一般包括单因素方差分析、双因素方差分析以及多因素方差分析。当方差分析中只涉及一个定类变量时,称为单因素方差分析,本篇案例采用单因素方差进行分析。
一、案例背景
用4种饲料喂猪,共19头猪分为4组,每组用1种饲料。一段时间后称重,比较4种饲料对猪体重增加的作用有无不同。部分数据如下:
二、预判断
1.正态性检验
进行方差分析前首先要判断数据是否满足正态性以及方差齐性,首先对因变量进行正态性检验,利用SPSSAU可视化的直方图,结果如下:
从图中可以看出数据大致呈现出中间高、两侧低、左右基本对称的“钟形”分布曲线。所以体重大致符合正态分布。接下来查看数据是否满足方差齐性。
2.方差齐性
分析方差齐检验是否呈现出显著性主要看p值,如果没有呈现出显著性(p>0.05);直接使用方差分析对比差异,如果呈现出显著性(p<0.05),可考虑使用Welch anova,Brown-Forsythe anova,或者非参数检验研究差异关系,从上表可以看出:p值为0.995大于0.05所以并未呈现出显著性,所以不同饲料样本对于体重全部均有着方差齐性。满足使用方差分析前提要求。
分析前可以考虑用图形简单判断‘4种饲料对猪体重增加的作用有无不同’。
3.图示化
可以使用折线图对数据进行简单描述,结果如下:
折线图中数值为不同饲料喂养猪的体重均值接连而成的,从折线图可以看出,不同饲料喂养猪是有明显差异的,从图片可以看出饲料D喂养的猪比较重。这表明饲料与猪的体重有一定的关系。
但是仅仅在散点图上观察还不能提供充分的证据证明不同饲料与猪体重之间有显著性差异,也许可能这种差异由于抽样的随机性造成的。所以需要更准确的方法来检验这种差异是否显著,也就是方差分析。
三、分析结果
方差分析结果将从四个方面进行说明,其中包括方差分析结果、图示化、中间过程值以及效应量指标。
1.方差分析结果
分析X与Y之间是否呈现出显著性(p值小于0.05或0.01);如果呈现出显著性;通过具体对比平均值大小,描述具体差异所在。从上表可以看出p值小于0.05,所以不同饲料样本对于体重全部均呈现出显著性差异。及具体对比差异可知, 有着较为明显差异的组别平均值得分对比结果为“B>A;C>A;D>A;C>B;D>B;D>C;D> C> B>A”。也就是说研究中D饲料的成效最好。
2. 图示化
从折线图中可以看出四种不同饲料直接的体重是具体差异性的,而且饲料D效果最好。接下来对方差结果的中间过程值进行描述。
3. 中间过程值
从上表可以看出组间差异为20538.698,组内差异是652.159,总差异是21190.858,其中组间均方为6846.233,组内均方为43.477,F值为157.467。并且p值小于0,05,说明不同饲料对于猪的体重有显著性差异。最后对效应量进行查看。
4.效应量指标
如果方差分析显示呈现出显著性差异(p<0.05),可通过平均值对比具体差异,同时还可使用效应量(Effect size)研究差异幅度情况。一般研究中不用过度关注,如果需要研究差异幅度时可以关注该指标。
四、总结
本篇案例利用单因素方差分析进行研究4种饲料对猪体重增加的作用有无不同,首先对数据进行预判断,判断数据是否满足正态性,方差齐性,以及对数据分布趋势进行简单查看,发现数据满足方差分析前提,接着对方差结果进行说明,其中包括4个方面,分析后发现4种饲料对猪体重增加的作用存在不同。分析结束。