会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
跳出
博客园
首页
新随笔
联系
订阅
管理
2016年8月29日
数据处理:离散化好处多
摘要: 离散化指把连续型数据切分为若干“段”,也称bin,是数据分析中常用的手段。切分的原则有等距,等频,优化,或根据数据特点而定。在营销数据挖掘中,离散化得到普遍采用。究其原因,有这样几点: ①算法需要。例如决策树,NaiveBayes等算法本身不能直接使用连续型变量,连续型数据只有经离散处理后才能进入算
阅读全文
posted @ 2016-08-29 17:20 跳出
阅读(1924)
评论(0)
推荐(0)
编辑
公告