会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
爱时尚疯了的朱
博客园
首页
新随笔
管理
2021年7月6日
数据清洗之重复值与缺失值的处理
摘要: 1.重复值的处理方法:所有字段完全相同的重复值,一般直接删除,即只保留一个。 2.缺失值的处理方法: 缺失值占比很高,可以删除(超过60%) 缺失值占比不高:使用均值,中位数,众数填充 缺失值占比不高:用模型拟合填充 3.使用零售电商数据进行举例: 代码: import pandas as pd #
阅读全文
posted @ 2021-07-06 20:07 爱时尚疯了的朱
阅读(839)
评论(0)
推荐(0)
编辑
公告