2019年4月17日

数据挖掘-数据清理过程

摘要: 数据清理-数据清理过程 数据清理过程的第一步是偏差检测(discrepancy detection)。 导致偏差的因素有很多,包括: 如何进行偏差检测 1. 警惕编码使用的不一致和数据表示的不一致问题(例如日期“2019/04/17”和“17/04/2019”)2. 根据唯一性规则、连续性规则和空值 阅读全文

posted @ 2019-04-17 22:31 嘣嘣嚓 阅读(477) 评论(0) 推荐(0) 编辑

导航