会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
香媛
博客园
首页
新随笔
联系
订阅
管理
2023年5月17日
数据质量
摘要: 一、规划 长期:基于Spark RDD,统一封装框架,支持多种监控项的配置,减轻数据核对的成本; 短期:需要梳理核心监控指标,以HQL为主,保证当前的数据质量; 范围:只包括基础事实表、维度表的数据质量验证; 二、校验类型 数据量是否一致(统计):比如:传统数仓比大数据多了多少条?差异是什么? 度量
阅读全文
posted @ 2023-05-17 16:28 香媛
阅读(60)
评论(0)
推荐(0)
编辑
公告