数据治理--政务行业项目 数据治理全流程,模板图片 各种规范 非常有用

 

 责任清单 

 

 

 

 

 

 

 

 数据接入后做数据标准和清洗

数据格式错误,记录数为空,数据重复,数据不准确,字段命名不统一

 

 数据标准主要是:元数据,分类与编码,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 数据标准化

 下一步:数据质量 主要是为了检查是否按照数据标准去做的

 

 稽核报告

 

 

 空值,准确性,格式,唯一性,一致性.

 

 

 

 

 

 

 

 

 

 

 

 

 

 基础信息用主题建模.例如各种详细信息表.  统计数据的用纬度建模方式

 

 只需要一个统计日为类似主键,下面全是纬度

 

 

 建表工具

 和业务密切相关的做切片表,例如用户表和客户表

 

 

 

 用拉链表的情况比较少,大多数用第二种切片的方式

 脚本处理工具

 

 

 

 

 

 数据资产

 

 

 

 

 

 

 

 

 

 

 

 技术架构

数据接入通过sqoop,数据库直连

对外提供数据接口是在hive上开发presto的API提供服务的

元数据检索放到ES里

 

 

 

 

 

posted @ 2024-06-04 23:33  十一vs十一  阅读(5)  评论(0编辑  收藏  举报