【stat】统计假设检验
当分布已知且符合一定条件时,比较均值采用z检验,t检验,比较方差采用F检验。
图自:04 T检验和Z检验 - 知乎 (zhihu.com)
z检验
用于比较两样本均值X^\bar, Y^_\bar。
两独立正态样本,方差已知。
样本比较大时可舍弃正态条件。
t检验
比较均值X^\bar, Y^_\bar。
使用前提是两样本X_i, Y_i独立,且样本均值X^\bar, Y^_\bar都服从正态分布。
除非数据分布是对称的(如双峰分布)或者样本量较大(>50),在不满足该条件时需进行数据转换。
当样本量较大时,根据中心极限定理,仍可应用t检验。
其中中心极限定理需要X_1-Y_1, X_2-Y_2,...独立同分布。(且期望、方差有限。)
方差是否相等影响t统计量的自由度的计算。所以检验方差是否相等时用到F检验。
方差不等时使用Welch's t检验来做转化。
SPSS实操:SPSS第五讲 | 两独立样本均数T检验,你会了吗? - 知乎 (zhihu.com)
两独立总体方差不等时转换公式:(23条消息) T检验_zrx731935354的博客-CSDN博客_t检验
F检验
F检验的三个应用。其中还有关于SSA, SSE的讨论
1.方差齐性检验
目的:方差齐性是方差分析和一些均值比较t检验的重要前提,利用F检验进行方差齐性检验是最原始的,但对数据要求比较高。
要求:样本来自两个独立的、服从正态分布的总体。
2.完全随机设计的单因素方差分析(completely randomized design one-way ANOVA)Analysis of Variance,简称ANOVA
统计量构造大致为组间方差去除以组内方差(各自除以自由度)
3.线性回归方程整体的显著性检验
回归平方和除以误差平方和(各自除以自由度)
当分布未知时,需要采用一些非参数检验。
卡方检验
1)卡方检验是一种用途很广的计数资料的假设检验方法,由卡尔·皮尔逊提出。
(1)它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)或两个分类变量的关联性分析。对总体的分布形态不作任何假设。
(2)其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
(3)卡方值描述两个事件的独立性或者描述实际观察值与期望值的偏离程度。卡方值越大,表名实际观察值与期望值偏离越大,也说明两个事件的相互独立性越弱。
(3)自由度计算:(行数-1)*(列数-1)
秩和检验
第十一讲 R-两独样本Wilcoxon检验 - 知乎 (zhihu.com)
将两独立非正态样本的中位数进行比较。
往往是小样本,因为大样本有机会用中心极限定理。
用到基于样本的秩次排列有关的统计量。
原假设是当两组样本分布相同时,单组的秩和是总秩和的一半。
在AB实验中的应用
t检验 双样本均值 人均播放时长,人均播放次数
比例检验 检验两组或多组二项分布的成功概率(比例)是否相等 播放用户占比,评论用户占比
Delta方法 检验比率指标(分子分母都是样本均值) CTR,相对差值(增量)
例如CTR=人均点击次数/人均海报曝光数=(用户点击次数/用户数) / (海报曝光次数/用户数)
卡方检验 检验样本率或分类变量 实验质量监控:实验中两组用户数是否符合预期的比例
不犯第二类错误的概率1-β
1-β=statistical power=备择假设为真时,统计量>z_(1-alpha) (即接受备择假设)的概率
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具