卡方
卡方检验
所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
如果理论数T<5但T≥1,并且1≥40,用连续性校正的卡方进行检验。
如果有理论数T<1或n<40,则用Fisher’s检验。
可以用于检验两个变量之间的关联性
Pearson卡方公式
卡方值计算:
自由度计算:
卡方分布的概率密度函数
其中O为单元格的观测值,E为该单元格的期望(该行总数 x 该列总数)/表格总数
k为自由度,r为行数,c为列数
f(x;k)为p-value值
计算方法
男化妆的期望值为 [(15+95)x(15+85)]/200=100 x (110/200) =55。
男生不化妆的期望值为 [(15+85) x (85+5)]/200=45。
女不化妆的期望值为 [(85+5) x (95+5) ] /200=100x ( 90/200 ) =45。
女生化妆的期望值为[ (15+95) x ( 95+5) ]/200 = 55
以第一个为例,110为所有人化妆的人数,除以200就是每个人化妆的概率,100为男生人数,若男生人数*总的化妆概率是期望的男生化妆人数,比较一下期望人数和实际人数的偏差,即可之后有没有关系。
若卡方值小于显著性p-value值(p-value为0.05时的值),则可以拒绝接受假设,就是变量没有联系,否则需要接受假设,就是变量之间有关系。
对于得到的p-value,与自己指定的显著性水平作比较(通常将0.05作为显著性水平),如果得到的p-value小于0.05,那我们认为样本所表现出来的结果是小概率事件,则我们有理由拒绝原假设H0;否则,我们需要接受原假设H0;
可以知道k=1,p-value=0.05时,值为3.84,计算得到的卡方值远大于3.84,可以说明有关系。
本文来自博客园,作者:Laplace蒜子,转载请注明原文链接:https://www.cnblogs.com/RedNoseBo/p/17835896.html