STEP2——《数据分析:企业的贤内助》重点摘要笔记(四)——数据清洗

笔记11 数据清洗三步骤——查重、改缺、纠错。

1、查重:选中数据所在区域——开始——条件格式——突出显示单元格规则——重复值

2、改缺:(1)查找空值:选中区域——F5——定位条件——空值

(2)处理缺失值(缺失值一定是空值,而空值不一定是缺失值):①漏录还是漏答——补充即可;②将有缺失值的记录删除;③将有缺失值的保留,仅在相应的分析中作必要的排出(适应于调差样本大、缺失值量小、且变量之间不存在高度相关的情况);④用某个统计值替代缺失值,最常用的是平均值。

(3)纠错

①非逻辑错误(人为因素造成)——解决方法:加强调研质量控制、电话复核、双录入

②逻辑错误——常见的2种:数值超出取值范围(筛选法、数据有效性)、该跳问的没有跳问(筛选法)

数值超出取值范围——方法一:设置数据有效性(提前防范):选择所在列——数据——数据验证——序列——输入取值范围——输入值超出取值范围即弹出错误提示

数值超出取值范围——方法二:设置数据有效性:取值范围来源于编码表——选取数值范围——定义名称——数据验证时在来源输入“=刚才定义的名称”

该跳问的没有跳问——如:在题目1中等于A的记录中,题目2——10应不为空;在题目1中等于B的记录中,题目2——10应为空。用筛选法来判断是否符合。

posted on 2019-01-19 19:02  JRxxxx  阅读(168)  评论(0编辑  收藏  举报