会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
oifengo
博客园
首页
新随笔
联系
订阅
管理
2018年4月17日
Kaggle爬梯之路
摘要: 一 数据质量分析 脏数据:不符合要求,不能进行分析的数据缺失值异常值不一致的值重复的数据含有特殊符号的数据(&×%¥) 数据缺失值分析删除可能值进行插补不处理> 异常值分析的三种方法 简单的统计量的分析数据应该有实际意义,手工去除不符合实际的数据 3σ原则异常...
阅读全文
posted @ 2018-04-17 20:01 oifengo
阅读(231)
评论(0)
推荐(0)
编辑
公告