摘要: 什么是脏数据? 数据仓库中的数据是面向某一个主题的数据集合,这些数据从多个业务系统中抽取,并且存在历史数据。这样就避免不了存在数据错误、数据冲突。这些错误数据和冲突数据就被称为脏数据。比如:不完整的数据、错误的数据、重复的数据。 洗数据:发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一 阅读全文
posted @ 2021-01-12 16:29 星海violet 阅读(939) 评论(1) 推荐(1) 编辑