摘要: 原始数据,如按年龄离散化 。首先元素各值频数的分布。 WOE(Weight of Evidence)反映了自变量对因变量的预测能力。 IV(Information Value)在预测模型中选择最重要的变量是最有用的技术之一。用于根据变量的重要性排列变量。 简化: 结果: IV 值经验规则: IV < 阅读全文
posted @ 2018-01-14 18:22 驯龙高手 阅读(800) 评论(0) 推荐(1) 编辑
摘要: 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。(更多参考:卡方检验、卡方分布) 不讲过多理论,主要使用 python 实现卡方验证。之前 阅读全文
posted @ 2018-01-14 08:56 驯龙高手 阅读(1735) 评论(0) 推荐(0) 编辑