摘要: 一、规划 长期:基于Spark RDD,统一封装框架,支持多种监控项的配置,减轻数据核对的成本; 短期:需要梳理核心监控指标,以HQL为主,保证当前的数据质量; 范围:只包括基础事实表、维度表的数据质量验证; 二、校验类型 数据量是否一致(统计):比如:传统数仓比大数据多了多少条?差异是什么? 度量 阅读全文
posted @ 2023-05-17 16:28 香媛 阅读(60) 评论(0) 推荐(0) 编辑