【stat】统计假设检验

当分布已知且符合一定条件时，比较均值采用z检验，t检验，比较方差采用F检验。

图自：04 T检验和Z检验 - 知乎 (zhihu.com)

z检验

用于比较两样本均值X^\bar, Y^_\bar。

两独立正态样本，方差已知。

样本比较大时可舍弃正态条件。

t检验

比较均值X^\bar, Y^_\bar。

使用前提是两样本X_i, Y_i独立，且样本均值X^\bar, Y^_\bar都服从正态分布。

除非数据分布是对称的（如双峰分布）或者样本量较大（>50），在不满足该条件时需进行数据转换。

当样本量较大时，根据中心极限定理，仍可应用t检验。

其中中心极限定理需要X_1-Y_1, X_2-Y_2,...独立同分布。（且期望、方差有限。）

方差是否相等影响t统计量的自由度的计算。所以检验方差是否相等时用到F检验。

方差不等时使用Welch's t检验来做转化。

SPSS实操：SPSS第五讲 | 两独立样本均数T检验，你会了吗？ - 知乎 (zhihu.com)

两独立总体方差不等时转换公式：(23条消息) T检验_zrx731935354的博客-CSDN博客_t检验

F检验

一文详解F检验 - 知乎 (zhihu.com)

F检验的三个应用。其中还有关于SSA, SSE的讨论

1.方差齐性检验

目的：方差齐性是方差分析和一些均值比较

要求：样本来自两个独立的、服从正态分布的总体。

2.完全随机设计的单因素方差分析（completely randomized design one-way ANOVA）Analysis of Variance，简称ANOVA

统计量构造大致为组间方差去除以组内方差（各自除以自由度）

3.线性回归方程整体的显著性检验

回归平方和除以误差平方和（各自除以自由度）

当分布未知时，需要采用一些非参数检验。

卡方检验

统计学干货：卡方检验和秩和检验 (qq.com)

1）卡方检验是一种用途很广的计数资料的假设检验方法，由卡尔·皮尔逊提出。

（1）它属于非参数检验的范畴，主要是比较两个及两个以上样本率(构成比)或两个分类变量的关联性分析。对总体的分布形态不作任何假设。

（2）其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

（3）卡方值描述两个事件的独立性或者描述实际观察值与期望值的偏离程度。卡方值越大，表名实际观察值与期望值偏离越大，也说明两个事件的相互独立性越弱。

（3）自由度计算：(行数-1)*(列数-1)

秩和检验

第十一讲 R-两独样本Wilcoxon检验 - 知乎 (zhihu.com)

将两独立非正态样本的中位数进行比较。

往往是小样本，因为大样本有机会用中心极限定理。

用到基于样本的秩次排列有关的统计量。

原假设是当两组样本分布相同时，单组的秩和是总秩和的一半。

在AB实验中的应用

t检验双样本均值人均播放时长，人均播放次数

比例检验检验两组或多组二项分布的成功概率（比例）是否相等播放用户占比，评论用户占比

Delta方法检验比率指标（分子分母都是样本均值） CTR，相对差值（增量）

例如CTR=人均点击次数/人均海报曝光数=(用户点击次数/用户数) / (海报曝光次数/用户数)

卡方检验检验样本率或分类变量实验质量监控：实验中两组用户数是否符合预期的比例

不犯第二类错误的概率1-β

1-β=statistical power=备择假设为真时，统计量>z_(1-alpha) （即接受备择假设）的概率

posted @ 2023-02-22 15:14 Raylan 阅读(425) 评论(0) 收藏举报

刷新页面返回顶部

Raylan

【stat】统计假设检验

公告