非参数统计
统计中的参数是什么?
大多数统计检验(如一般的线性模型)都假定某种基本分布,如正态分布。
如果你知道正态分布的平均值和标准偏差,那么你就知道如何计算概率。
均值和标准差称为参数,所有的理论分布都有参数。
假设分布和使用参数的统计测试称为参数测试。
不假定分布或不使用参数的统计测试称为非参数测试。
================================================
为什么我们使用非参数检验?
虽然自然界中的许多东西都是正态分布的,但有些却不是。例如,在这些情况下,使用t检验可能是不适当的和误导的。
非参数检验对数据的假设或限制较少。
非正态分布的例子:
定性数据:种族、性别、
有序的分类数据:轻度,中度,重度
利克特量表:强烈不同意,不同意,没有意见,同意,强烈同意
================================================
非参数测试如何工作?
大多数非参数检验在假设检验中使登等级而不是原始数据。
例句:用等级法比较女生和男生的考试成绩。
零假设:中值是平均数
================================================
非参数试验的优势
适用于任何尺度
容易计算----最初是在广泛使用计算机之前开发的
少作假设
不需要涉及总体参数
结果可能和参数程序一样精确。
==============================================
非参数试验的缺点
可能浪费信息
如果数据允许使用参数过程
示例:将数据从比率转换为序数比例尺
P值(表)未广泛提供
非参数检验综述
不考虑组的排名数据
使用组排名的和(或其他函数)来计算测试统计量
在表中或在计算机中查找p值
拒绝或失败以拒绝零假设
Sign test:略
如果没有真正的治疗效果,我们将假设有相同数量的+和-体征。
两组之间是否有显着性差异(和-)?我们如何计算p值?
===============================================
威氏符号秩次检验:略
==============================================
符号检验
不太强大
-- 不那么敏感
--更宽的置信区间
使用更少的信息
-只显示差异
威氏符号秩次检验
·更强大
-更敏感
-置信区间更窄
使用更多信息
-也是只显示差异。
=======================================
当我们有配对数据,并且不满足配对t检验的假设时,我们有两种方法来完成假设检验。
Wilcoxon符号等级测试总是比符号测试更好,因为它使用了更多的数据(因为它使用等级)。Wilcoxon符号秩检验具有更强的检测差异的能力。
当正态假设成立时,使用Wilcoxon符号秩检验与t检验相比,没有大的功率损失。当正态假设不成立时,Wilcoxon要强大得多。
因此,如果正态假设有怀疑,使用Wilcoxon符号秩检验更合适,即Wilcoxon符号秩检验正态与否通吃。
===========================================
Wilcoxon秩和检验
我们想知道两组的成本是否相同。
既然我们有两个独立的样本,可以使用两个样本测试。
请注意,这两个图看起来不正常,并且有许多异常值。
由于我们有两个独立的样本,而t检验是不合适的,所以我们需要一个非参数检验。
我们感兴趣的是中位数,而不是平均数。
利息的假设检验是
摘要:Wilcoxon秩和检验也称为Mann-Whitney检验。
检验两个独立的总体概率分布
对应于2个独立手段的t检验。
如果n大于10可以用正态拟合
前提:1.随机抽样2.这两个样品是独立的。3.样本数据至少是顺序的。4.这两个总体仅是位置不同。
===========================================
比较
|
H0 |
固定信息 |
随机信息 |
测试统计量 |
注 |
|
|
|
|
|
|
Sign |
“+”的概率与“-”的概率相同 |
非零差数 |
每一种差异的符号 |
“+S”数 |
理论上的二项分布 |
Wilcoxon |
关于零的对称性 |
差异绝对值 |
每一种差异的符号 |
正秩和 |
|
Mann |
来自同一分布的两组 |
两组中的等级 |
数据点的组成员 |
最小群的秩和 |
群随机分配 |
============================
Kruskal-Wallis(H)(用于序数数据)