线性相关系数总结
1. 定量资料相关
1.1 . Pearson相关系数
正态分布,定量资料的线性关系
1.2. Spearman相关系数
非正态分布的定量资料或等级资料间的相关性。
1.3. 偏相关
是去掉其它因素的混杂,是两个变量间的“纯正”线性关系。
1.4
方差是自己对自己的关系。
协方差是变量间的的关系。
缺点是协方差随着原始数值增大而增大。
所以需要对原始数据标准化。
标准化后的原始数据,再计算协方差,此时的协方差就是相关系数。
DATA example6_1; INPUT bmi Le fbg; datalines; 19.19 4.21 5.1O 21.10 4.25 5.10 20.56 4.34 5.10 22.15 4.51 5.70 22.19 4.72 5.30 19.56 4.79 5.60 26.64 4.80 5.10 25.80 1.97 5.60 21.88 5.01 5.70 21.08 5.11 5.10 25.25 5.23 5.90 25.59 5.25 5.00 23.23 5.28 5.80 21.17 5.83 5.90 27.44 5.89 5.08 27.18 6.05 5.70 27.46 6.07 5.90 28.93 6.17 6.20 24.49 6.68 5.90 ; ods html; proc corr data = example6_1; var bmi le fbg; with le; partial le; run;
with le;是和le两两比较。
patial le;是去掉le这个混杂作用。
pearson fisher选型用来输出置信区间。其思路和t检验完全相同,只不过标准误的公式换了。
2. 分类资料的相关
不要求行或列有序,因为就是单纯的分类资料。
Phi系数两个二元变量(dichotomous variable)的关联性度量。最大值为1,最小值为0.
Pearson列联相关系数:最大为0.707,难以解释。
Cramer V系数:用于大于2x2列联表。是Phi系数的扩展。
coefficient of contingency列连相关系数:主要用于大于2×2列联表的情况。
上面两个直接 freq / chisq就可以得出来。
一致性系数:table / agree主要是说两次测量间的相关性。与之一起打印出来的 Mc Nemar’s test(差异性检验),Bowker’s test of symmetry(symmetry检验);
一致性是说多次检测,多次检验结果是否一致。
相关性是说某次测量中,两个变量间有无关系。
本文来自博客园,作者:Iving,转载请注明原文链接:https://www.cnblogs.com/SAS-T/p/15568775.html