模型是对现实世界特征的模拟和抽象,数据模型是对现实世界数据特征的抽象。最常用的数据模型分为:
- 概念数据模型(信息模型):是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象。他强调语义表达功能,易于用户理解,是用户和数据库设计人员交流的语言,主要用于数据库设计。这类模型中最著名的是实体联系模型(E-R模型)。
- 基本数据类型:按计算机系统的观点对数据建模,是现实世界数据特征的抽象,用于DBMS的实现。基本的数据模型有层次模型、网状模型、关系模型和面向对象模型。
从事物的客观特性到计算机中的具体表示涉及三个数据领域:现实世界、信息世界和机器世界。
- 现实世界:现实世界的数据就是客观存在的各种报表、图表和查询格式等原始数据。计算机只能处理数据,所以首先要解决的问题是按用户的观点对数据和信息建模,即抽取数据库技术所研究的数据,分门别类,综合出系统所需要的数据。
- 信息世界:是现实世界在人们头脑中的反映,人们用符号、文字记录下来。在信息世界中,数据库常用的术语是实体、实体集、属性和码。
- 机器世界:是按计算机系统的观点对数据建模。机器世界中数据描述的术语有字段、记录、文件和记录码。
信息世界和机器世界相关数据的对应关系如下:
- 属性和字段。属性是描述实体某方面的特性,字段标记实体属性的命名单位。例如,用“书号、书名、作者、出版社、日期”5个属性描述书的特性,对应有5个字段。
- 实体和记录。实体表示客观存在并能相互区别的事物(如一个学生、一本书);记录是字段的有序集合,一般情况下,一条记录描述一个实体。例如,“10001, Database system concepts, China Machine Press, 2000-2”描述的是一个实体,对应一条记录。
- 码和记录码。码也称键,是能唯一区分实体的属性或属性集;记录码是唯一标识文件中每条记录的字段或字段集。
- 实体集和文件。实体集是具有共同特性的实体的集合,文件是同一类记录的汇集。例如,所有学生构成了学生实体集,而所有学生记录组成了学生文件。
- 实体型和记录型。实体型是属性的集合,如表示学生学习情况的属性集合为实体型(Sno, Sname, Sage, Grade, SD, Cno, ...)。记录型是记录的结构定义。
数据模型的三要素
- 数据结构:是所研究的对象类型的集合,是对系统静态特性的描述
- 数据操作:是指对数据库中各种对象型的实例值允许执行的操作的集合,包括操作的操作规则。如操作有检索、插入、删除、修改,操作规则有优先级别等。数据操作是对系统动态特性的描述。
- 数据的约束条件:是一组完整性规则的集合。也就是说,对于具体的应用数据必须遵循特定的语义约束条件,以保证数据的正确、有效和相容。例如,某单位人事管理中,要求在职的男职工的年龄必须大于18小于60岁,工程师的基本工资不能低于4500元,每个职工可以担任一个工种,这些要求可以通过建立数据的约束条件来实现。