会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lyqf
博客园
首页
新随笔
联系
订阅
管理
2021年1月12日
脏数据+清洗数据
摘要: 什么是脏数据? 数据仓库中的数据是面向某一个主题的数据集合,这些数据从多个业务系统中抽取,并且存在历史数据。这样就避免不了存在数据错误、数据冲突。这些错误数据和冲突数据就被称为脏数据。比如:不完整的数据、错误的数据、重复的数据。 洗数据:发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一
阅读全文
posted @ 2021-01-12 16:29 星海violet
阅读(939)
评论(1)
推荐(1)
编辑
公告