元数据,数据管理的三大终极问题
要做好数据管理,就必须了解元数据。
什么是元数据?元数据就是解释数据的相关数据。这个解释不太容易理解,换个说法:
元数据管的就是数据领域的三大终极问题。
1、这个数据是什么?(我是谁)
2、它的数据源在哪里?(我从哪里来)
3、哪个系统还需要这个数据?(我要到哪里去)
我是谁?
有关数据的“我是谁”的问题,其实就是数据标准,企业应该对每一个关键数据都要制定相应的数据标准,数据标准的内容包括业务属性、技术属性和管理属性。
数据标准的业务属性包括:数据主题、数据分类、数据编码、数据名称、数据的业务定义、数据的业务规则、数据的同义词,如果是统计类数据,还应该有计算公式和统计维度等相关信息。
数据标准的技术属性包括:数据类型、数据格式、编码规则、取值范围、数据源信息、计量单位、数据生成频率、数据计算周期、数据取值精度等。
数据标准的管理属性包括:数据的定义者、管理者、使用者和维护者,数据标准的版本、数据的业务应用领域等信息。
通过数据标准,企业可以把这个数据是什么数据解释清楚。
我从哪里来?
有关数据的“我从哪里来”这个问题,其实就是数据源的管理规范。
企业应该对关键数据的数据源进行定义,关键数据的数据源应该是唯一的,同一个数据不应该在多个地方都有录入,应该坚持一个数据、一个源头、多点调用的原则。
企业需要对内部的所有关键数据进行数据源的排查和认证,在数据应用时,只允许调用认证数据源产生的数据。
这方面的内容,在企业内部的落地就是《数据资产目录》,通过清晰明了的《数据资产目录》,让各单位、各部门十分方便地找到自己需要且准确的数据。
我要到哪里去
有关数据的“我要到哪里去”这个问题,其实就是对数据的应用,主要体现在主数据分发、数据分析和数据消费等等方面。
在企业内部的落地体现是《数据分布》,其内容主要包括:
1、数据在业务流程中的流转
2、数据在IT系统中的流转
通过对“三大终极问题”的回答,元数据就清晰地展现在我们面前。元数据管理,可以让我们很方便地理解数据,知道数据的来龙去脉和前世今生,对于数据管理领域,元数据是必不可少的基础管理环节。