摘要: 一、定义 数据分箱就是将连续变量离散化。 二、意义 • 离散特征可变性强,易于模型的快速迭代; • 稀疏向量运算速度快,方便存储; • 变量离散化后对异常数据有很强的鲁棒性; • 特征离散以后,模型会更加稳定; • 将逻辑回归模型转换成评分卡形式的时候,分箱也是必须的。 三、分类 四、卡方分箱 (1 阅读全文
posted @ 2018-11-27 11:40 Christina_笔记 阅读(8202) 评论(0) 推荐(1) 编辑