摘要: 建模数据的预处理的过程中,变量分箱(即变量离散化)往往是较为核心一环。变量分箱的优劣往往会影响模型评分效果. 一,数据分箱的重要性 1.对异常数据有比较好的鲁棒性. 2.在逻辑回归模型中,单个变量分箱之后每个箱有自己独立的权重,相当于给模型加入了非线性的能力,能够提升模型的表达能力,极大拟合. 3. 阅读全文
posted @ 2019-12-06 15:37 猪突猛进!!! 阅读(1653) 评论(0) 推荐(0) 编辑