摘要: 1.数据质量分析 数据质量分析主要任务:检查原始数据是否存在脏数据。 脏数据: 缺失值 异常值 不一致的值 重复数据及含有特殊符号(如:#、¥、*)的数据 1.1 缺失值分析 数据缺失主要包括:记录的缺失、记录中某个字段信息的缺失。 缺失值产生原因: 有些信息暂时无法获取,获取信息代价太大 部分信息 阅读全文
posted @ 2018-01-16 00:15 Nice1949 阅读(1699) 评论(0) 推荐(0) 编辑