方差分析中均值比较的方法
转载:http://blog.sina.com.cn/s/blog_5de124240101q55q.html
最近看文献时,多数实验结果用到方差分析,但选的方法不同,主要有LSD,SNK-q,TukeyHSD法等,从百度广库里找了一篇文章,大概介绍这几种方法,具体公式不列了,软件都可以计算。这几种方法主要用于方差分析后,对均数间进行两两比较。
均数间的两两比较根据研究设计的不同分为两种类型 : 一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别问的关系已有定论、无需再探究,经方差分析结果提示 “ 概括而言各组均数不相同”后,对每一对样本均数都进行比较,从中寻找有统计学意义的差异: 另一种是在设计阶段根据研究目的或专业知识所决定的某些均数问的比较.常见于证实性研究中多个处理组与对照组、施加处理后的不同时间点与处理前比较。最初的设计方案不同.对应选择的检验方法也不同. 下面分述两种不同设计均数两两比较的方法选择。
1. 事先计划好的某对或某几对均数间的比较
适用于证实性研究。在设计时就设定了要比较的组别,其他组别间不必作比较。常用的方法有: Dunnett-t 检验 、LSD-t 检验 (Fisher ’s least significant difference t test) 。这两种方法不管方差分析的结果如何——即便对于 P稍大于检验水平α进行所关心组别间的比较。
1.1 LSD-t检验即最小显著法
是Fisher于1935年提出的, 多用于检验某一对或某几对在专业上有特殊探索价值的均数间的两两比较,并且在多组均数的方差分析没有推翻无效假设H0时也可以应用。该方法实质上就是 t检验, 检验水准无需作任何修正,只是在标准误的计算上充分利用了样本信息,为所有的均数统一估计出一个更为稳健的标准误, 因此它一般用于事先就已经明确所要实施对比的具体组别的多重比较。由于该方法本质思想与 t 检验相同, 所以只适用于两个相互独立的样本均数的比较。LSD法单次比较的检验水准仍为α , 因此可以认为该方法是最为灵敏的两两比较方法.另一 方面,由于LSD法侧重于减少第Ⅱ类错误, 势必导致此法在突出组间差异的同时,有增大I类错误的倾向。
1.2 Dunnett-t(新复极差法)检验
Duncan 1955年在Newman及Keuls的复极差法(muhiple range method)基础上提出,该方法与Tukey法相类似。适用于n-1个试验组与一个对照组均数差别的多重比较,多用于证实性研究。 Dunnett-t统计量的计算公式与LSD-t检验完全相同。
实验组和对照组的样本均数和样本含量。需特别指出的是Dunnett—t检验有专门的界值表,不同于t检验的界值表 。
一般认为,比较组数k≥3时,任何两个样本的平均数比较会牵连到其它平均数的对比关系,而使比较数再也不是两个相互独立的样本均数的比较.这是LSD-t无法克服的缺点。Dunnett—t针对这一问题提出.在同一显著水平上两个均数的最小显著差数随着这二个平均数在多个平均数中所占的极差大小而不同,根据不同平均数间的对比关系来调整相应的显著差别(critical range)的大小。
2. 多个均数的两两事后比较
适用于探索性研究,即各处理组两两问的对比关系都要回答,一般要将各组均数进行两两组合,分进行检验。常用的方法有:SNK-q(Student-Newman-Keuls q)法、Duncan法、Tukey法和Scheffe法。值得注意的是,这几种方法对数据有具体的要求和限制。而文献中我最常见的是Tukey法与SNK-q法,。
2.1 SNK-q检验
对于SNK-q检验,检验的统计量是q,所以又称为q检验。SNK-q检验的原理是根据所包含不同数目的平均数的极差调整各自的显著性水准,限制了实验的误差.保证在做所有比较时,不易犯第1类错误。
2.2 Tukey法
Tukey法(Tukey’S Honestly Significant Diference Tukey’s HSD)的原理与SNK-q检验基本相同,但是,该方法要求各比较组样本含量相同 ,它将所有对比组中I类错误最大者控制在α之内。
研究显示:这种方法有较高的检验效能(与LSD法比较),具有很好的稳定性,适用于大多数场合下的两两比较,计算简便。但是,Tukey法是基于比较组全部参与比较这一假设下进行的,因此在只比较指定的某几组总体均数时并不适用,建议选择Dunnett法或者是Bonferroni方法,因为这两种方法会给出较高效能的检验结果。
2.3 Scheffe法
与一般的多重比较不同,Scheffe法的实质是对多组均数间的线性组合是否为0进行假设检验,多用于对比组样本含量不等的资料。在单因素的多重比较问题中,除了要逐对比较因素水平的平均效应之外,有时还有可能要比较因素水平平均效应的线性组合。例如将有基本相同的因素水平平均效应的几个组,构成一个综合组。因此可能检验这样的假设:
显然,前面讨论的参数的两两比较属于一类特殊的对比。Scheffe法可以同时检验所有可能的对比,即同时检验任何一组对比。Scheffe法的优点是可以检验任意的线性对比。在这方面,Tukey法不如Scheffe法。但是在单纯作逐对因素效应均值的比较时,Schefe法的效率不如Tukey法高。也就是说,Schefe法更易于将显著的差异判定为不显著(Tukey法认为)。在实际场合,当单纯作逐对均值
比较时,建议用Tukey法;而当要做多个一般的线性对比检验时。就要用Scheffe法。
Scheffe法检验实质上对F值进行了简单的校正,将比较的组数纳入考虑的范畴,该方法的检验统计量代表了最大可能的累积I类错误的概率。遗憾的是,由于控制I类错误时的“矫枉过正”.会最终导致较大的Ⅱ类错误的概率。
3. 探索性研究和证实性研究均适用的检验方法
3.1 Bonferroni t检验
基本思想是:如果三个样本均数经ANOVA检验差异有统计学意义(α=0.05),需对每两个均数进行比较,共需比较的次数为3次,由于每进行一次比较犯I类错误的概率是α=0.05,那么比较3次至少有一次犯I类错误的概率就是:α’=1-0.953≈0.1426>0.05。因此,要使多次比较犯I类错误的概率不大于原检验水准α,现有的检验水准应该进行调整,用α’=α/m作为检验水准的调整值,两两比较得出的P值与其进行比较。该方法的思想适用于所有的两两比较,并且该方法的适用范围很广,不仅仅限于方差分析,例如相关系数的检验和卡方检验也适用。Bonferroni t检验的方法和思想容易理解,操作简便,但是严格地控制了I类错误的同时增大了Ⅱ类错误的发生概率,在结论的给出方面是一种比较保守的方法。
3.2 Sidak检验
该方法通过Sidak校正降低每次两两比较的I类错误概率,以达到最终整个比较的I类错误发生率不超过α的目的。
Bonferroni t检验与Sidak检验相似,Bon.ferroni t检验是检验的近似计算,但是由于Bonferroni t检验在计算上容易实现,所以应用较广。相比较而言,Bonferroni t检验在给出推断结论时更为审慎。不容易得到拒绝零假设的结果。两种检验在对比组数增加、比较组不独立时,推断结论更趋保守。
以上方法都必须在满足方差齐性的前提条件时才可以应用,另外还有一些方法是在不满足方差齐性时多重比较的方法:Tamhane’s T2,Dunnetts’s T3, Games-Howell, Games-Howell。
3.3Tamhane’s T2
是一种基于t检验原理的两两比较方法。该方法比较保守。
3.4Dunnetts’s T3
则是以最大的t值(studentized maximum modulus)为基础的。
3.5Games-Howell检验方法
是比较宽大的一种两两比较方法。Games-Howell 方法将方差不齐的组数作为一个影响因素纳入考虑范畴。严重的方差不齐和样本含量过小都会使I类错误的概率增加。Games-Howell检验基于Welch’s对t检验的自由度进行校正,并使用了学生化极差作为统计量。该检验适用于样本含量小且方差不齐(轻度方差不齐例外)时的情况。该方法是方差不齐时的一种较好的方法。
3.6Dunnett’s
是一种基于学生化极差的适用于方差不齐情况时两两比较的方法。
下图是进行方差分析的流程图