统计学的统一(2)
上一篇讲了计量资料的统计,这一次我们来看看二分类的统一。。
转载请注明出处:https://www.cnblogs.com/SSSR/p/11007023.html
data logistic ;
input accident age vision drive ;
datalines ;
1 17 1 1
1 44 0 0
1 48 1 0
1 55 0 0
1 75 1 1
0 35 0 1
0 42 1 1
0 57 0 0
0 28 0 1
0 20 0 1
0 38 1 0
0 45 0 1
0 47 1 1
0 52 0 0
0 55 0 1
1 68 1 0
1 18 1 0
1 68 0 0
1 48 1 1
1 17 0 0
1 70 1 1
1 72 1 0
1 35 0 1
1 19 1 0
1 62 1 0
0 39 1 1
0 40 1 1
0 55 0 0
0 68 0 1
0 25 1 0
0 17 0 0
0 45 0 1
0 44 0 1
0 67 0 0
0 55 0 1
1 61 1 0
1 19 1 0
1 69 0 0
1 23 1 1
1 19 0 0
1 72 1 1
1 74 1 0
1 31 0 1
1 16 1 0
1 61 1 0
;
run;
proc logistic data=logistic descending ;
model accident=vision; run ;
quit;
ods trace on ;
ods output chisq crosstabfreqs ;
proc freq data= logistic;
table accident*vision/chisq cmh ;/*cmh会计算出优比*/
run ;
ods trace off ;
ods output close ;
proc genmod data=logistic descending;
model accident=vision /dist=bin link=logit;
ESTIMATE 'vision' vision 1 -1/exp;
run;
/*以分组汇总后的的方式统计的数据,使用weight*/
data a;
input accident vision f;
cards;
0 0 14
0 1 6
1 0 8
1 1 17
;
run;
proc logistic data=a descending;
model accident=vision;
weight f;
run ;
quit;
检验全局零假设: BETA=0 | |||
---|---|---|---|
检验 | 卡方 | 自由度 | Pr > 卡方 |
似然比 | 6.5830 | 1 | 0.0103 |
评分 | 6.4209 | 1 | 0.0113 |
Wald | 6.0756 | 1 | 0.0137 |
最大似然参数估计的分析 | |||||||
---|---|---|---|---|---|---|---|
参数 | 自由度 | 估计 | 标准 误差 | Wald 95% 置信限 | Wald 卡方 | Pr > 卡方 | |
Intercept | 1 | -0.5596 | 0.4432 | -1.4283 | 0.3090 | 1.59 | 0.2067 |
vision | 1 | 1.6011 | 0.6496 | 0.3280 | 2.8742 | 6.08 | 0.0137 |
尺度 | 0 | 1.0000 | 0.0000 | 1.0000 | 1.0000 |
proc freq data=a;
table accident*vision/chisq cmh;
weight f;
run;
表“vision-accident”的统计量 |
统计量 | 自由度 | 值 | 概率 |
---|---|---|---|
卡方 | 1 | 6.4209 | 0.0113 |
似然比卡方检验 | 1 | 6.5830 | 0.0103 |
连续调整卡方 | 1 | 4.9902 | 0.0255 |
Mantel-Haenszel 卡方 | 1 | 6.2783 | 0.0122 |
Phi 系数 | 0.3777 | ||
列联系数 | 0.3534 | ||
Cramer V | 0.3777 |
Fisher 精确检验 | |
---|---|
单元格 (1,1) 频数 (F) | 14 |
左侧 Pr <= F | 0.9980 |
右侧 Pr >= F | 0.0122 |
表概率 (P) | 0.0102 |
双侧 Pr <= P | 0.0169 |
样本大小 = 45 |
“vision-accident”的汇总统计量 |
Cochran-Mantel-Haenszel 统计量(基于表评分) | ||||
---|---|---|---|---|
统计量 | 备择假设 | 自由度 | 值 | 概率 |
1 | 非零相关 | 1 | 6.2783 | 0.0122 |
2 | 行评分均值差异 | 1 | 6.2783 | 0.0122 |
3 | 一般关联 | 1 | 6.2783 | 0.0122 |
普通优比和相对风险 | ||||
---|---|---|---|---|
统计量 | 方法 | 值 | 95% 置信限 | |
优比 | Mantel-Haenszel | 4.9583 | 1.3881 | 17.7107 |
Logit | 4.9583 | 1.3881 | 17.7107 | |
相对风险(第 1 列) | Mantel-Haenszel | 2.1875 | 1.1541 | 4.1461 |
Logit | 2.1875 | 1.1541 | 4.1461 | |
相对风险(第 2 列) | Mantel-Haenszel | 0.4412 | 0.2144 | 0.9077 |
Logit | 0.4412 | 0.2144 | 0.9077 |
标红部分的值是相等。freq步还给出了or值
proc genmod data=a descending;
model accident=vision /dist=bin link=logit;
weight f;
ESTIMATE 'vision' vision 1 -1/exp; /*给出or值*/
run;
与逻辑回归的结果是完全一致的。。。OR值都是一致的。后面会介绍怎么用genmod计算RR值。。。
最大似然参数估计的分析 | |||||||
---|---|---|---|---|---|---|---|
参数 | 自由度 | 估计 | 标准 误差 | Wald 95% 置信限 | Wald 卡方 | Pr > 卡方 | |
Intercept | 1 | -0.5596 | 0.4432 | -1.4283 | 0.3090 | 1.59 | 0.2067 |
vision | 1 | 1.6011 | 0.6496 | 0.3280 | 2.8742 | 6.08 | 0.0137 |
尺度 | 0 | 1.0000 | 0.0000 | 1.0000 | 1.0000 |
对比估计结果 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
标签 | 均值估计 | 均值 | L'Beta 估计 | 标准 误差 | Alpha | L'Beta | 卡方 | Pr > 卡方 | ||
置信限 | 置信限 | |||||||||
vision | 0.8322 | 0.5813 | 0.9466 | 1.6011 | 0.6496 | 0.05 | 0.3280 | 2.8742 | 6.08 | 0.0137 |
Exp(vision) | 4.9583 | 3.2207 | 0.05 | 1.3881 | 17.7107 |