认识元数据-元数据分类

1.什么是元数据

    元数据是描述数据的组织、数据域及其关系的信息,简言之数据的相关信息而存在的数据,有了元数据可以帮助我们更好的理解业务,实现业务,实现数据资产化。

 

2.元数据的类型

    元数据主要分为技术元数据,业务元数据,管理元数据三大类。

技术元数据

    技术元数据是为数仓开发和数仓管理人员服务的,它描述了数仓开发相关的数据,包括数据源信息,数据转换描述,数据仓库模型,数据清洗规则,数据映射,数据字典等。

1、数据库对象或者数据源信息,比如是mysql还是oracle等信息。

2、物理数据库表名,备注,主键,索引。

3、物理表的大小,行数,文件数,分区数,存储类型,表类型,索引名称,索引字段,索引类型,约束,表功能描述等。

4、字段属性,包括字段名,字段注释,字段类型,是否主键,是否自增,是否外键,清洗逻辑等。

5、ETL 作业详细信息,名称,责任人,脚本,任务配置(执行时间,执行频率,是否互斥,上游依赖等),任务调度时长,产出信息等。

6、数据血缘,表/字段级别的上下游依赖关系,任务输入/输出表依赖关系。

7、数据备份策略。

业务元数据

    从业务角度描述数据,提供了介于使用者和实际系统之间的语义层,使不懂IT技术的业务人员也能够读懂数据仓库中的数据。

1、数据库表所属的业务域,所在的项目。

2、指标定义、业务分类、业务规则、转换规则、计算公式、推导公式等。

3、数据模型及数据应用。

4、数据标准、数据质量规则和核检结果。

5、数据的安全,隐私级别。

6、数据使用说明等。

管理元数据(操作元数据)

    管理元数据用来定义系统中涉及管理领域的相关概念等信息,包括人员角色、岗位职责等内容,例如对项目管理、IT运维、IT资源设备等相关信息的描述,这里元数据主要被企业IT部门的管理人员使用。

1、数据所有者、使用者等。

2、数据的访问方式、访问时间、访问限制等。

3、数据访问权限、组和角色等。

4、数据处理作业的结果、系统执行日志等。

5、数据备份、归档人、归档时间等。

6、表上线下线时间等。

 

posted @ 2023-07-27 14:45  人不疯狂枉一生  阅读(172)  评论(0编辑  收藏  举报