【数据分析师 Level 1 】5.方差分析
1.方差分析
方差分析可以提高假设检验的效率,增加了分析的可靠性
方差分析的基本原理
指根据试验结果,鉴别各个有关因素对试验结果影响的有效方法。是方差的可加性原则
方差分析的基本假设
- 各个总体都应服从正态分布
- 各个总体的方差都必须相同
- 观察值是独立的
单因素方差分析
指将所获得的数据按某些项目分类后,再分析各组数据之间有无差异的方法,其本质是检验多个总体均值是否相等,其计算过程可以理解为是变异分解过程。
单因素反差分析的基本步骤
-
提出假设,
-
各个平均值相等,即自变量对因变量没有显著影响
-
构造检验统计量(F统计量)
-
统计决策(根据P值)
2.计算F统计量
第一步:变异分解
为了构造检验统计量,在方差分析中,需要计算三个误差平方和(总体平方和、组间平方和、组内平方和)
-
总体平方和
-
组间平方和
-
组内平方和
-
SSA是对于随机误差和系统误差大小的度量,反映的是自变量对于因变量的影响,也叫做自变量效应
SSE是对于随机误差大小的度量,反映的是除自变量和因变量影响之外的,其他因素对因变量的总的影响,称做残差效应
SST是总平方和,是对于全部误差程度的影响,反映的是自变量和残差变量的共同影响,等于SSA+SSE
计算均方
-
组间均方
-
SSA的自由度为k−1
-
组内均差
-
SSE的自由度为n−k
3.计算检验统计量F
4.统计决策
将统计量的值F与给定的显著性水平α的临界值Fα进行比较(或者用P值与α比较),做出原假设 H 0 的决策
例题精讲
1.下列方差分析以下说法不正确的是?
A.方差分析同时检验多组均值是否存在差异的问题
B.方差分析同时检验两组均值是否存在差异的问题
C.方差分析不能同时检验两组均值是否存在差异的问题
答案:C
解析:这里的主要干扰项是方差分析能不能处理两组均值的差异问题,其实是可以的,例如检验条件满足的前提下,t方和F检验的显著性是等价的
2.有关方差分析不正确的是?
A.方差分析可以对若干组均值是否相等同时进行检验
B.方差分析要求各组内的样本为小样本
C.正态分布是方差分析的前提条件
D.方差的可加性表述为离差平方和等于组内方差与组间方差之和
答案:B
解析:A项说的就是F检验,B项“方差分析要求各组内的样本为小样本”,这并不是方差分析的条件,C项是前提条件,D项是方差分析的基本原理
3.方差不满足齐性检验,以下不正确的是()
A.不同组均值隐含的信息不同,需要修正
B.正态分布的前提条件无法满足
C.影响不同组均值的计算
D.数据分析结果无法推理到总体
答案:BC
解析:A项方差大小意味着均值隐含信息的多少,是对的;D项中“数据分析结果无法推理到总体”,指的是对p值得影响,B项,因为即使方差不齐也可能是满足正态分布的,C项是由一组数据计算而来的,与方差齐性显然没有关系
posted on 2020-11-22 20:11 pandaboy1123 阅读(741) 评论(0) 编辑 收藏 举报