相关性分析
---------------------------相关性分析-------------------------------
定量资料的相关性分析
-
可以是线性,也可以是非线性
- 正态分布
- Pearman相关系数
- 偏态分布
- Spearman相关系数
- 分别对Xi和Yi进行编秩
- Spearman相关系数
- 正态分布
-
Proc corr <选项>;
-
Pearson 该选项要求输出Pearson相关系数,也是程序默认的输出结果 Spearman 该选项要求输出Spearman相关系数 Fisher 输出相关系数的可信区间 -
Var变量1变2 …;
-
Partial 变量1 变量2 …;用于偏相关,控制协变量(比较纯的相关系数,得出的结果为偏相关系数)
-
Run
绘制散点图
-
proce corre plots=matrix(histogram)
- histogram 为在散点图中加不加直方图,有则加无则不加
分类变量的关联性分析
-
无序非配对资料
- pearson列联系数,r
- phi系数
- Cramer V系数
-
配对资料
- Kappa系数
-
Proc freq <选项>;
-
Table 行列 / <选项>;
-
chisq 可输出Pearson χ2检验、似然比检验、Mantel-Haenszel检验、phi系数、列联系数等值。 四格表还可输出连续校正χ2检验和Fisher确切检验 trend 输出趋势检验结果,仅限于2×C表或R×2表 agree 用于配对检验,可输出一致性系数。对四格表还给出McNemar配对检验结果,对R×R表给出Boeker对称性检验结果 nopercent 不显示总数的百分比 norow 不显示行合计的百分比 nocol 不显示列合计的百分比 exected 显示理论数 fisher 输出Fisher确切概率
-
-
Test 统计量关键字;
-
kappa 对一致性系数(Kappa系数)进行统计学检验 measures 对tabled语句中measures选项输出的所有关联系数进行检验 pcorr 对Pearson相关系数进行检验 scorr 对Spearman相关系数进行检验
-
-
Weight 权重变量;
-
By 分层变量;
-
Run;
有序资料
-
spearman相关系数
-
proc corr spearman;
var a b;
freq f;
run;
-----------------------------------------总结 -------------------------------------------------
方法选择:
-
对于定量资料,如果数据符合正态分布,可以采用Pearson相关分析,如果资料不服从正态分布,可采用Spearman相关分析。三个及以上的变量分析,可采用偏相关,以校正混杂因素的影响。
-
对于定性资料,如果数据为非配对资料,可采用perason、phi系数、Cramer系数等表示相关性。如果是配对资料,还可采用Kappa一致性检验
-
如果相关系数很小,P值提示无统计学意义,结论只能说“无线性相关”,但不能说“无相关性”
-
分类资料的关联性和一致性的区别
-
一致性主要用于两种属性同时作用于同一批数据,如两位专家同时对同一个人打分,两种方法同时对一批样品检测等
-
关联性所用的场合要宽泛一些,基本上可以用于任意两个属性之间的关联性表示,包括一致性所用的情形。如某指标的阴性阳性与疾病发生与否的关系、两种基因型的关系等。
-
一般来讲,强的一致性会出现强的关联性,而强的关联性则不一定出现强的一致性。
-
记录学习的点点滴滴