摘要: 模型开发 注意:如果使用全模型法,所有自变量必须是连续型 data imputed;set imputed; 离散型的转化resr = (res='R');resu = (res='U');run;proc logistic data = imputed des; des表示1对应发生响应事件 mo 阅读全文
posted @ 2019-02-20 22:07 碎纸屑 阅读(535) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归 基本流程 模型开发阶段:数据处理 ——变量筛选和压缩——logit图——模型开发 模型验证:数据处理——误分类矩阵——ROC图——模型比较——模型确认 模型测试:收益矩阵——打分——决策 模型实施: 数据采样: 1、总体已知,反应数据过少,保留所有反应数据,使得反应数据在采样后的数据集占有 阅读全文
posted @ 2019-02-20 20:47 碎纸屑 阅读(342) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归 假设在自变量X1,X2,..Xn作用下,某事件发生的概率为p,则该事件不发生的概率为1-p ,p/(1-p) 为发生的概率和不发生的概率之比,记做优势odds 若对odds取自然对数,得到 称为P的logit变换, 则logistic回归模型为: 则概率计算公式为 没有连续的值的情况称作哑 阅读全文
posted @ 2019-02-20 14:45 碎纸屑 阅读(342) 评论(0) 推荐(0) 编辑
摘要: 模型诊断 残差检验 y与y估计值的差异 要服从正态分布 模型诊断 学生化残差:标准差除以残差 1、如果是相对小的样本 该值应该在-2到+2之间 2、如果说相对大的样本 该值应该在-3到+3之间 强影响点判断 没有建立模型的意义 四个统计量判断 共线性诊断 方差膨胀因子: Ri是第i个变量与其他变量之 阅读全文
posted @ 2019-02-20 12:54 碎纸屑 阅读(438) 评论(0) 推荐(0) 编辑