皮尔逊相关系数检验 | 斯皮尔曼等级相关系数检验 | 肯德尔相关系数检验
PEARSON’S PRODUCT MOMENT CORRELATION COEFFICIENT T-TEST皮尔逊积矩相关系数t检验,又叫皮尔逊积矩相关系数t检验
用途:用来检验两个连续变量是否具有显著相关性
原假设:两个变量没有显著相关性(相关系数显著不为0)
备择假设:两个变量具有相关性
要求:
1.两个变量可以具有不同的尺度,也就是说可以具有不同的量纲,不需要标准化;
2.两个变量的样本量大小相同;
3.两变量的各自分布接近正态分布;
4.两变量的联合分布接近二元正态分布。
实际应用中可能3,4没有那么严格。
R代码实现:
> x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1)
> y <- c( 2.6, 3.1, 2.5, 5.0, 3.6, 4.0, 5.2, 2.8, 3.8)
The test statistic can be calculated for the above data by typing:
>cor.test(x,y,method="pearson",alternative="two.sided",conf.level = 0.95)
Pearson's product-moment correlation
data: x and y
t = 1.8411, df = 7, p-value = 0.1082
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1497426 0.8955795
sample estimates:
cor
0.5711816
结果显示,统计量t=1.8411,t为t检验的统计量;
df=7,即9-2=7,样本量-变量个数;
p-value = 0.1082,即t检验显著性p值;
95%置信区间[-0.1497426,0.8955795],其中包含0;
cor = 0.5711816,相关系数值。
结论:因为p-value = 0.1082,小于0.05(或者更为严格的0.01),不能否定原假设,即皮尔逊积矩相关系数t检验结果显示不能证明这两个变量的相关系数显著不为0,尽管相关系数比较大。
SPEARMAN RANK CORRELATION TESTSpearman秩相关检验
用途:用于研究等级(定序)相关变量相关性检验的方法。只要两个变量是成对的等级数据,或者由连续变量观测到的数据转化而成的等级数据,不对样本的分布做要求。
R代码实现:
> x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1)
> y <- c( 2.6, 3.1, 2.5, 5.0, 3.6, 4.0, 5.2, 2.8, 3.8)
>cor.test(x,y,method="spearman",alternative="two.sided")
Spearman's rank correlation rho
data: x and y
S = 48, p-value = 0.0968
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.6
结果显示,统计量t=1.8411,t为t检验的统计量;
S=48,表示每个样本点等级之差的平方的和;
p-value = 0.0968,即t分布显著性p值;
rho = 0.6,相关系数值。
KENDALL’S TAU CORRELATION COEFFICIENT TEST肯德尔系数T检验
用途:适用于定序变量或者不满足正态分布假设的间隔数据。
肯德尔系数T:统计对象A和B都有两个或多个属性,若按照某个属性排序,其他属性通常是乱序的。统计对象A在所有属性排名中都排在B前面,则称A和B是同序对,反之称为异序对。
同序对和异序对总数之差与总对数的比值为肯德尔系数T。
肯德尔系数计算公式:
T=(P-(n*(n-1)/2-P))/(n*(n-1)/2)=(4P/(n*(n-1)))-1
其中P指同序对数目,n为单个变量的样本数目。
肯德尔系数T为1,则A和B的属性正相关。
肯德尔系数为-1,则A和B的属性负相关。
肯德尔系数为0,则A和B的属性独立。
R代码实现:
> x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1)
> y <- c( 2.6, 3.1, 2.5, 5.0, 3.6, 4.0, 5.2, 2.8, 3.8)
> cor.test(x,y,method="kendal",alternative="two.sided")
Kendall's rank correlation tau
data: x and y
T = 26, p-value = 0.1194
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.4444444
结果显示,tau = 0.4444444,肯德尔相关系数;
T= 26,为同序对数目;
p = 0.1194,显著性p值。