会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
冷幽篁
博客园
首页
新随笔
联系
管理
订阅
2018年4月19日
python数据探索
摘要: 数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布情况下,小概率事件为异常值 不服从正太分布的,可以用原离平均值多少倍标准差来分析 (3)箱线图分析 使用descri
阅读全文
posted @ 2018-04-19 14:06 冷幽篁
阅读(927)
评论(0)
推荐(0)
编辑
公告