会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
mxo
博客园
首页
新随笔
联系
订阅
管理
2016年3月27日
特征工程
摘要: 特征工程: 一.数据处理 1.数据收集 埋点,mysql,hdfs,日志等收集。 2.数据清洗 a.不符合常理数据 b.超出统计值的数据 c.缺省值极多的字段 3.数据采样 (1)正样本大于负样本,且相差很大 下采样(截取与负样本量相近的正样本) (2)正样本大于负样本,相差不大 a.采集跟多数据
阅读全文
posted @ 2016-03-27 11:17 xmeo
阅读(350)
评论(0)
推荐(0)
编辑
公告