|NO.Z.00024|——————————|^^ 修订 ^^|——|Hadoop&PB级离线数仓.v03|——|Griffin.v03|数据质量监控|
一、与电商业务集成
### --- 数据资产:单击右上角的 DataAssets 来检查数据资产
~~~ 这里的数据数据资产主要是保存在Hive上的表,要求 Hive Metastore 服务正常

### --- 创建 measure
~~~ 如果要测量源和目标之间的匹配率,请选择 Accuracy(精确度验证)
~~~ 如果要检查数据的特定值(例如:空列计数),请选择 Data Profiling(数据统计分析)
~~~ 统计表的特定列里面值为空、唯一或是重复的数量
~~~ 统计最大值、最小值、平均数、中值等
~~~ 用正则表达式来对数据的频率和模式进行分析

~~~ # 核心交易分析中有两张表:
~~~ dws_trade_orders(订单明细)
~~~ dws_trade_orders_w(订单明细宽表)
~~~ # 这两张表的数据量应该是相等的(Accuracy)
~~~ # 计算ODS层
~~~ ods_trade_orders(订单表)
~~~ # 订单表的数据量(Data Profiling)
Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
分类:
dov001-PB离线数仓
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」