会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Christina_笔记
博客园
首页
新随笔
联系
订阅
管理
2018年11月27日
数据分箱
摘要: 一、定义 数据分箱就是将连续变量离散化。 二、意义 • 离散特征可变性强,易于模型的快速迭代; • 稀疏向量运算速度快,方便存储; • 变量离散化后对异常数据有很强的鲁棒性; • 特征离散以后,模型会更加稳定; • 将逻辑回归模型转换成评分卡形式的时候,分箱也是必须的。 三、分类 四、卡方分箱 (1
阅读全文
posted @ 2018-11-27 11:40 Christina_笔记
阅读(8267)
评论(0)
推荐(1)
编辑
公告