数据元与元数据
数据元
定义:
- 用一组属性描述定义、标识、表示和允许值的数据单元。 数据的基本单元。
- 每个数据元的确切含义需要通过一系列属性来说明,包括数据的定义、标识、表示方法和管理等
- 通过定义、标识、表示以及允许值等一系列属性(元数据)描述的数据单元,被认定为是不可再分的最小的数据单元。
- 数据元一般来说由三部分组成:对象、特性、表示。
比如:人的性别,“人”为对象词,“性别”为该数据元的特性词,“男/女”为数据元的表示词
完整的数据元名称=对象类术语+特征类术语+表示类术语+(限定类术语)
数据元一般由对象类、特性和表示3部分组成(特征:有且仅有一个)
- 对象类(Object Class)。是现实世界或抽象概念中事物的集合,有清楚的边界和含义,并且特性和其行为遵循同样的规则而能够加以标识。
- 特性(Property)。是对象类的所有个体所共有的某种性质,是对象有别于其他成员的依据。
- 表示(Representation)。是值域、数据类型、表示方式的组合,必要时也包括计量单位、字符集等信息。
对象类是我们所要研究、收集和存储相关数据的实体,例如人员、设施、装备、组织、环境、物资等。特性是人们用来区分、识别事物的一种手段,例如人员的姓名、性别、身高、体重、职务,坦克的型号、口径、高度、长度、有效射程等。表示是数据元被表达的方式的一种描述。表示的各种组成成分中,任何一个部分发生变化都将产生不同的表示,例如人员的身高用“厘米”或用“米”作为计量单位,就是人员身高特性的两种不同的表示。数据元的表示可以用一些具有表示含义的术语作标记,例如名称、代码、金额、数量、日期、百分比等。
数据元作用
- 数据元本身也是数据单元,即也是数据。
- 它就是一个用来对各行业的数据进行自身规范化的一个方法或一套指导的理论。
- 用这一套方法对行业数据进行统一的名、型、值规范及分类。
- 规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。
元数据
定义:
- 就是“描述数据的数据”或“关于数据的结构化数据”
- 哈佛大学数字图书馆项目定义: 元数据是帮助查找、存取、使用和管理信息资源的信息。
- 是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。
- 描述数据的内容(what)、覆盖范围(where, when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的桥梁;
- 数据是手提箱,而元数据是它上面的姓名标牌;
- 数据是文件夹,而元数据是夹子的标签;
- 数据是书的内容,元数据是书脊上的杜威十进制数码。
元数据作用
数据描述: |
对信息对象的内容属性等的描述能力是元数据最基本的功能。 |
数据检索: |
支持用户发现资源的能力即利用元数据来更好地组织信息对象建立它们之间的关系为用户提供多层次多途径的检索体系从而有利于用户便捷快速地发现其真正需要的信息资源 |
数据选择: |
支持用户在不必浏览信息对象本身的情况下能够对信息对象有基本的了解和认识从而决定对检出信息的取舍 |
数据定位: |
提供信息资源本身的位置方面的信息如DOI URL URN 等信息由此可准确获知信息对象之所在便于信息的获取 |
数据管理: |
保存信息资源的加工存档结构使用管理等方面的相关信息以及权限管理版权所有权使用权防伪措施电子水印电子签名等 |
数据评估: |
保存资源被使用和被评价的相关信息通过对这些信息的统计分析方便资源的建立与管理者更好地组织资源并在一定程度上帮助用户确定该信息资源在同类资源中的重要性 |
作者:苏su
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.