第一章 数据库概述

1.1数据库概述

1.1.1 数据的4个基本概念

数据

  • 数据(Data)——是数据库中存储的基本对象
    • 数据的定义
      • 描述事物的符号记录
    • 数据的种类
      • 数字、文字、图形、图像、音频、视频、学生的档案记录等

数据库

  • 数据库(DataBase,简称DB)
    • 数据库是⻓期储存计算机内、有组织的可共享大量数据的集合。
      • 基本特点:永久存储、有组织、可共享
    • 数据库的基本特征
      • 数据按一定的数据模型组织、描述和储存
      • 可为各种用户共享
      • 冗余度较小
      • 数据独立性较高
      • 易扩展

数据库管理系统

  • 数据库管理系统(DataBase Management System, DBMS)
    • 主要功能
      • 数据定义功能
        • 提供数据定义语言(DDL)
        • 定义数据库中的数据对象
        • 数据组织、存储和管理
      • 分类组织、存储和管理各种数据
        • 确定组织数据的文件结构和存取方式
        • 实现数据之间的联系
        • 提供多种存取方法提高存取效率
      • 数据操纵功能
        • 提供数据操纵语言(DML)
        • 实现对数据库的基本操作 (查询、插入、删除和修改)
      • 数据库的事务管理和运行管理
        • 数据库在建立、运行和维护时由数据库管理系统统一管理和控制
        • 保证数据的安全性、完整性、多用户对数据的并发使用
        • 发生故障后的系统恢复
      • 数据库的建立和维护功能
        • 数据库初始数据的装载和转换
        • 数据库转储、恢复功能
        • 数据库的重组织
        • 性能监视、分析等
      • 其它功能
        • 数据库管理系统与网络中其它软件系统的通信
        • 数据库管理系统系统之间的数据转换
        • 异构数据库之间的互访和互操作

数据库系统

  • 数据库系统(Database System,简称DBS)
    • 构成
      • 数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员
      • IMG_AFB45039520A-1

1.1.2 数据管理技术的产生和发展

  • 什么是数据管理
    • 对数据进行分类、组织、编码、存储、检索和维护
    • 数据处理的中心问题 数据管理技术的发展过程
  • 数据管理技术的发展过程
    • 人工管理阶段(20世纪50年代中之前)
      • 数据的管理者:用户(程序员),数据不保存
      • 数据面向的对象:某一应用程序
      • 数据的共享程度:无共享、冗余度极大
      • 数据的独立性:不独立,完全依赖于程序
      • 数据的结构化:无结构
      • 数据控制能力:应用程序自己控制
    • 文件系统阶段(20世纪50年代末--60年代中)
      • 数据的管理者:文件系统,数据可⻓期保存
      • 数据面向的对象:某一应用
      • 数据的共享程度:共享性差、冗余度大
      • 数据的结构化:记录内有结构,整体无结构
      • 数据的独立性:独立性差
      • 数据控制能力:应用程序自己控制
    • 数据库系统阶段(20世纪60年代末--现在)
      • 数据的共享程度:共享性高、冗余度低,易扩充
      • 数据的结构化:数据结构化
      • 数据的独立性:独立性高
      • 数据控制能力:数据由DBMS统一管理和控制

小结

  • 数据库是⻓期存储在计算机内有组织的大量的共享的数据集合。
  • 可以供各种用户共享,具有最小冗余度和较高的数据独立性。
  • 数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。

1.2 数据模型

  • 数据模型是对现实世界数据特征的抽象。
  • 通俗地讲数据模型就是现实世界的模拟
  • 数据模型应满足三方面要求:
    • 能比较真实地模拟现实世界
    • 容易为人所理解
    • 便于在计算机上实现
  • 数据模型是数据库系统的核心和基础

1.2.1 两类数据模型

概念模型

  • 也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计

逻辑模型和物理模型

  • 逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
  • 物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。

客观对象的抽象过程---两步抽象

  1. 现实世界中的客观对象抽象为概念模型;
    • 现实世界抽象为信息世界
  2. 把概念模型转换为某一数据库管理系统DBMS支持的数据模型。
    • 信息世界转换为机器世界

fig:

1.2.2 概念模型

概念模型的用途

  • 概念模型用于信息世界的建模
  • 是现实世界到机器世界的一个中间层次
  • 是数据库设计的有力工具
  • 数据库设计人员和用户之间进行交流的语言

对概念模型的基本要求

  • 较强的语义表达能力
  • 简单、清晰、易于用户理解

信息世界中的基本概念

  1. 实体(Entity)
    • 客观存在并可相互区别的事物称为实体。
    • 可以是具体的人、事、物或抽象的概念。
      • 如老师、老师和学院的工作关系;
  2. 属性(Attribute)
    • 实体所具有的某一特性称为属性。
    • 一个实体可以由若干个属性来刻画。
      • 学生 : 学号 姓名 性别 出生年月...
  3. 码(Key)
    • 唯一标识实体的属性集称为码。
      • 学号是学生实体的码
  4. 实体型(Entity Type)
    • 用实体名及其属性名集合来抽象和刻画同类实体称为实体型
      • 学生( 学号 姓名 性别 出生年月)就是一个实体型
  5. 实体集(Entity Set)
    • 同一类型实体的集合称为实体集
      • 全体学生
  6. 联系(Relationship)
    • 现实世界中事物内部以及事物之间的联系在信息世界 中反映为实体(型)内部的联系和实体(型)之间的联系。
    • 实体内部的联系通常是指组成实体的各属性之间的联系
    • 实体之间的联系通常是指不同实体集之间的联系
    • 实体之间的联系有一对一、一对多和多对多等多种类型

两个实体型间的联系

  • 一对一联系(1:1)
    • 如果对于实体集 A 中的每一个实体,实体集 B至多有一个实体与之联系,反之亦然,则称实体集 A 与实体集 B 具有一对一联系。记为 1:1
  • 一对多联系(1:n)(n0)
    • 如果对于实体集 A 中的每一个实体,实体集 B 中有 n 个实体(n0)与之联系,反之, 对于实体集 B 中的每一个实体,实体集 A 中至多只有一个实体与之联系,则称实体集 A 与实体集 B 有一对多联系,记为 1:n
  • 多对多联系(m:n) (m0),(n0)
    • 如果对于实体集 A 中的每一个实体,实体集 B 中有 n 个实体(n0)与之联系,反之, 对于实体集 B 中的每一个实体,实体集 A 中也有 m 个实体(m0)与之联系,则称 实体集 A 与实体 B 具有多对多联系。记为 m:n

# 概念模型的表示方法(肯定要考)

  • 实体-联系方法(E-R 方法)(第七章)
    • 用 E-R 图来描述现实世界的概念模型
    • E-R方法也称为E-R模型

1.2.3 数据模型的组成要素

数据结构

描述数据库的组成对象,以及对象之间的联系

  • 描述的内容
    1. 与对象的类型、内容、性质有关的
    2. 与数据之间联系有关的对象
  • 数据结构是所描述的对象类型的集合,对系统静态特性的描述。

一些gpt的解释(看看就行)

假设我们有一个图书馆管理系统的数据库,用于存储图书馆的书籍信息。在这个数据库中,我们需要描述书籍这一对象类型,以及与之相关的属性和数据之间的关系。

数据结构是对这些对象类型的集合进行描述,对系统静态特性做出定义。在这个例子中,数据结构可以定义书籍这一对象类型的属性和关系,包括以下内容:

  1. 对象类型的集合:数据库中可能存在多个对象类型,其中一个对象类型就是书籍。数据结构定义了对象类型的属性和关系,以及它们之间的联系。
  2. 属性的描述:对于书籍对象类型,可以定义一些属性,如书名、作者、出版社、ISBN 码等。这些属性描述了书籍的特征,它们属于书籍对象类型的一部分,由数据结构进行定义。
  3. 数据之间的关系:在图书馆管理系统中,书籍与其他对象类型之间可能存在一些关系。例如,书籍可以与读者之间建立借阅关系,书籍可以属于某个具体的图书馆分馆等。这些关系也可以在数据结构中定义和描述。

通过这样的数据结构定义,数据库系统可以更好地理解和管理图书馆的书籍信息。它可以提供一种静态的描述,使系统能够更好地处理和操作数据,如搜索、过滤、排序等,以满足图书馆管理的需要。

数据操作

对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则

  • 数据操作的类型
    • 查询
    • 更新(包括插入、删除、修改)
  • 数据模型对操作的定义
    • 操作的确切含义
    • 操作符号
    • 操作规则(如优先级)
    • 实现操作的语言
  • 数据操作是对系统动态特性的描述。

数据的完整性约束条件

一组完整性规则的集合

  • 完整性规则
    • 给定的数据模型中数据及其联系所具有的制约和依存规则
    • 用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容
  • 数据模型对完整性约束条件的定义
    • 反映和规定必须遵守的基本的通用的完整性约束条件。
      • 任何关系都必须满足实体完整性和参照完整性两个条件
    • 提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
      • 65岁退休 60分以下不及格

1.2.4 常用的数据模型

非关系模型/格式化模型

数据结构:以基本层次联系为基本单位

基本层次联系:两个记录以及他们之间的一对多(包括一对一)的联系

  • 层次模型(Hierarchical Model)
  • 网状模型(Network Model)

关系模型(Relational Model))

面向对象数据模型(Object Oriented Data Model)

对象关系数据模型(Object Relational Data Model)

半结构化数据模型(Semistruture Data Model)

1.2.5 层次模型

层次模型的数据结构

满足下面两个条件的基本层次联系的集合为层次模型

  1. 有且只有一个结点没有双亲结点,这个结点称为根结点
  2. 根以外的其它结点有且只有一个双亲结点

fig:

  • 层次模型的特点
    • 结点的双亲是唯一的
    • 只能直接处理一对多的实体联系
    • 每个记录类型可以定义一个排序字段,也称为码字段
    • 任何记录值只有按其路径查看时,才能显出它的全部意义
    • 没有一个子女记录值能够脱离双亲记录值而独立存在

fig:

fig:

层次模型的数据操纵

  • 查询
  • 插入
  • 删除
  • 更新

层次模型的完整性约束条件

  • 无相应的双亲结点值就不能插入子女结点值
  • 如果删除双亲结点值,则相应的子女结点值也被同时删除
  • 更新操作时,应更新所有相应记录,以保证数据的一致性

层次模型的优缺点

  • 优点
    • 层次模型的数据结构比较简单清晰
    • 查询效率高,性能优于关系模型,不低于网状模型
    • 层次数据模型提供了良好的完整性支持
  • 缺点
    • 结点之间的多对多联系表示不自然
    • 对插入和删除操作的限制多,应用程序的编写比较复杂
    • 查询子女结点必须通过双亲结点
    • 层次命令趋于程序化

网状和层次数据模型的表示方法

  • 实体型:
    • 用记录类型描述
    • 每个结点表示一个记录类型(实体)
  • 属性:
    • 用字段描述
    • 每个记录类型可包含若干个字段
  • 联系:
    • 用结点之间的连线表示
    • 记录类型(实体)之间的一对多的父子联系

网状模型与层次模型的区别

  • 网状模型允许多个结点没有双亲结点
  • 网状模型允许结点有多个双亲结点
  • 网状模型允许两个结点之间有多种联系(复合联系)
  • 网状模型可以更直接地描述现实世界
  • 层次模型实际上是网状模型的一个特例

1.2.6 网状模型

  • 网状数据库系统采用网状模型作为数据的组织方式
    • 典型代表是DBTG系统
    • 亦称CODASYL系统

网状模型的数据结构

满足下面两个条件的基本层次联系的集合:

  1. 允许一个以上的结点无双亲;
  2. 一个结点可以有多于一个的双亲。

fig:

网状模型的操纵与完整性约束

  • 网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束
    • 码:唯一标识记录的数据项的集合
    • 一个联系中双亲记录与子女记录之间是一对多联系
    • 支持双亲记录和子女记录之间某些约束条件 (你删我也删)

网状模型的优缺点

  • 优点
    • 能够更为直接地描述现实世界,如一个结点可以有多个双亲
    • 具有良好的性能,存取效率较高
  • 缺点
    • 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
    • DDL数据定义、DML数据操纵语言复杂,用户不容易使用
    • 记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节

1.2.7 关系模型

关系模型中的数据操作是集合操作,操作对象和操作结果都是关系

关系模型把存取路径向用户隐蔽起来,用户只要指出“干什么”或“找什么”,不比详细说明“怎么干”或“怎么找”

关系模型的数据结构

  • 用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
  • fig:

关系模型的一些术语

关系术语

一般表格的术语

 

关系名

表名

 

关系模式

表头(表格的描述)

 

关系 (Relation)

(一张)二维表

 

元组 (Tuple)

记录或行,表中的一行即为一个元组

 

属性 (Attribute)

 

属性名

列名

 

属性值

列值

 

主码(Key)

也称码键。表中的某个属性组,它可以唯一确定一个元组

 

域(Domain)

是一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
例如大学生年龄的域(15~45)

 

分量

一条记录中的一个列值,元组中的一个属性值

 

关系模式

对关系的描述
关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系名,年级)

 

非规范关系

表中有表(大表中嵌有小表)
关系必须是规范化的,满足一定的规范条件
最基本的规范条件:关系的每一个分量必须是一个不可分的

 

fig:

关系模型的完整性约束

  • 实体完整性
  • 参照完整性
  • 用户定义的完整性

关系数据模型的存储结构

  • 表以文件形式存储
  • 有的 DBMS 一个表对应一个操作系统文件
  • 有的 DBMS 自己设计文件结构

关系模型的优缺点

  • 优点
    • 建立在严格的数学概念的基础上
    • 概念单一
      • 实体和各类联系都用关系来表示
      • 对数据的检索结果也是关系
    • 关系模型的存取路径对用户透明(透明的意思是看不见)
      • 具有更高的数据独立性,更好的安全保密性
      • 简化了程序员的工作和数据库开发建立的工作
  • 缺点
    • 存取路径对用户透明,查询效率往往不如格式化数据模型
    • 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度

1.3 数据库系统的结构

  • 数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构
  • 从数据库最终用户角度看,数据库系统的结构分为:
    • 单用户结构
    • 主从式结构
    • 分布式结构
    • 客户-服务器
    • 浏览器-应用服务器/数据库服务器多层结构等

1.3.1 数据库系统模式的概念

“型” 和“值” 的概念

  • 型(Type)
    • 对某一类数据的结构和属性的说明
    • 学生记录型:
    • (学号,姓名,性别,系别,年龄,籍贯)
  • 值(Value)
    • 是型的一个具体赋值
    • 一个记录值:
    • (201315130,李明,男,计算机系,19,江苏南京市)

模式(Schema)

  • 数据库中全体数据的逻辑结构和特征的描述
  • 是型的描述,不涉及具体值
  • 反映的是数据的结构及其联系
  • 模式是相对稳定的

实例(Instance)

  • 模式的一个具体值
  • 反映数据库某一时刻的状态
  • 同一个模式可以有很多实例
  • 实例随数据库中的数据的更新而变动

数据库模式定义了数据库中数据的结构和组织方式,是数据库的设计蓝图;而数据库实例则是数据库模式的运行时表现,是根据数据库模式创建出来的具体数据库的数据内容和状态。数据库模式和数据库实例之间的关系可以类比为“类(class)”和“对象(object)”之间的关系,是静态和动态的关系。

1.3.2 数据库系统的三级模式结构

fig:

模式(Schema)(也称逻辑模式)

  • 数据库中全体数据的逻辑结构和特征的描述
  • 所有用户的公共数据视图
  • 一个数据库只有一个模式
  • 模式的地位:是数据库系统模式结构的中间层
    • 与数据的物理存储细节和硬件环境无关
    • 与具体的应用程序、开发工具及高级程序设计语言无关
  • 模式的定义
    • 数据的逻辑结构(数据项的名字、类型、取值范围等)
    • 数据之间的联系
    • 数据有关的安全性、完整性要求
  • 全局逻辑结构是数据库的中心与关键
  • 独立于数据库的其他层次
  • 设计数据库模式结构时应首先确定数据库的逻辑模式

外模式(External Schema)(也称子模式或用户模式)

  • 数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述
  • 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
  • 外模式的地位:介于模式与应用之间
    • 模式与外模式的关系:一对多
    • 外模式通常是模式的子集
    • 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
    • 对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
    • 外模式与应用的关系:一对多
    • 同一外模式也可以为某一用户的多个应用系统所使用
    • 但一个应用程序只能使用一个外模式
  • 外模式的用途
    • 保证数据库安全性的一个有力措施
    • 每个用户只能看见和访问所对应的外模式中的数据
  • 面向具体的应用程序
  • 定义在逻辑模式之上
  • 独立于存储模式和存储设备
  • 当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
  • 设计外模式时应充分考虑到应用的扩充性

内模式(Internal Schema)(也称存储模式)

  • 是数据物理结构和存储方式的描述
  • 是数据在数据库内部的表示方式
    • 记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)
    • 索引的组织方式
    • 数据是否压缩存储
    • 数据是否加密
    • 数据存储记录结构的规定
  • 一个数据库只有一个内模式
  • 依赖于它的全局逻辑结构
  • 独立于数据库的用户视图,即外模式
  • 独立于具体的存储设备
  • 将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率

特定的应用程序

  • 在外模式描述的数据结构上编制的
  • 依赖于特定的外模式
  • 与数据库的模式和存储结构独立
  • 不同的应用程序有时可以共用同一个外模式

数据库的二级映像

  • 保证了数据库外模式的稳定性
  • 从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改

1.3.3 数据库的二级映像功能与数据独立性

  • 数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去
  • 数据的存取由数据库管理系统管理
    • 简化了应用程序的编制
    • 大大减少了应用程序的维护和修改

三级模式是对数据的三个抽象级别

二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换

  • 外模式/模式映像
  • 模式/内模式映像

外模式/模式映像

  • 模式:描述的是数据的全局逻辑结构
  • 外模式:描述的是数据的局部逻辑结构
  • 同一个模式可以有任意多个外模式
  • 每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
  • 映象定义通常包含在各自外模式的描述中
  • 保证数据的逻辑独立性
    • 当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变
    • 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性

模式/内模式映像

  • 模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
    • 例如,说明逻辑记录和字段在内部是如何表示的
  • 数据库中模式/内模式映象是唯一的
  • 该映象定义通常包含在模式描述中
  • 保证数据的物理独立性
    • 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
    • 应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。

1.4 数据库系统的组成

数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成

硬件平台及数据库

  • 数据库系统对硬件资源的要求
    • 足够大的内存
    • 足够的大的磁盘或磁盘阵列等设备
    • 较高的通道能力,提高数据传送率

软件

  • 数据库管理系统
  • 支持数据库管理系统运行的操作系统
  • 与数据库接口的高级语言及其编译系统
  • 以数据库管理系统为核心的应用开发工具
  • 为特定应用环境开发的数据库应用系统

人员

fig:

数据库管理员(DBA administrator)

具体职责:

  1. 决定数据库中的信息内容和结构
  2. 决定数据库的存储结构和存取策略
  3. 定义数据的安全性要求和完整性约束条件
  4. 监控数据库的使用和运行
    • 周期性转储数据库
      • 数据文件
      • 日志文件
    • 系统故障恢复
    • 介质故障恢复
    • 监视审计文件
  5. 数据库的改进和重组
    • 性能监控和调优
    • 定期对数据库进行重组织,以提高系统的性能
    • 需求增加和改变时,数据库须需要重构造

系统分析员

  • 负责应用系统的需求分析和规范说明
  • 与用户及数据库管理员结合,确定系统的硬软件配置
  • 参与数据库系统的概要设计

数据库设计人员

  • 数据库设计人员
  • 参加用户需求调查和系统分析
  • 确定数据库中的数据
  • 设计数据库各级模式

应用程序员

设计和编写应用系统的程序模块

进行调试和安装

最终用户

用户是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。

  1. 偶然用户
    • 不经常访问数据库,但每次访问数据库时往往需要不同的数据库信息
    • 企业或组织机构的高中级管理人员
  2. 简单用户(多数)
    • 主要工作是查询和更新数据库
    • 银行的职员、机票预定人员、旅馆总台服务员
  3. 复杂用户
    • 工程师、科学家、经济学家、科技工作者等
    • 直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的应用程序接口编制自己的应用程序

课后习题

  1. 试述数据、数据库、数据库系统、数据库管理系统的概念。
  • 答:
  • 数据( Data ) :描述事物的符号记录称为数据。数据的种类有数字、文字、图形、图像、声音、正文等。数据与其语义是不可分的。
  • 解析:在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据。现代计算机能存储和处理的对象十分广泛,表示这些对象的数据也越来越复杂。数据与其语义是不可分的。 500 这个数字可以表示一件物品的价格是 500 元,也可以表示一个学术会议参加的人数有 500 人,还可以表示一袋奶粉重 500 克。
  • 数据库( DataBase,简称DB ):数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
  • 数据库管理系统( DataBase Management System,简称DBMS):数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。 DBMS的主要功能包括数据定义功能;数据组织、存储和管理;数据操纵功能;数据库的事务管理和运行管理;数据库的建立和维护功能;其它功能等。
  • 解析:DBMS是一个大型的复杂的软件系统,是计算机中的基础软件。目前,专门研制 DBMS 的厂商及其研制的 DBMS产品很多。著名的有美国IBM公司的DB2关系数据库管理系统和IMS层次数据库管理系统、美国Oracle公司的Oracle关系数据库管理系统、美国微软公司的SQL Server关系数据库管理系统等。
  • 数据库系统( DataBase System,简称DBS):数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员等构成。
  • 解析:数据库系统和数据库是两个概念。数据库系统是一个人-机系统,数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把数据库系统简称为数据库。希望读者能够从人们讲话或文章的上下文中区分“数据库系统”和“数据库”,不要引起混淆。
  1. 使用数据库系统有什么好处?
  • 答:使用数据库系统的好处是由数据库管理系统的特点或优点决定的。使用数据库系统的好处很多,例如:
  • 可以大大提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担,等等。使用数据库系统可以大大提高应用开发的效率。因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径,这些工作都由 DBMS 来完成。用一个通俗的比喻,使用了 DBMS 就如有了一个好参谋、好助手,许多具体的技术工作都由这个助手来完成。开发人员就可以专注于应用逻辑的设计,而不必为数据管理的许许多多复杂的细节操心。
  • 还有,当应用逻辑改变,数据的逻辑结构也需要改变时,由于数据库系统提供了数据与程序之间的独立性,数据逻辑结构的改变是 DBA 的责任,开发人员不必修改应用程序,或者只需要修改很少的应用程序,从而既简化了应用程序的编制,又大大减少了应用程序的维护和修改。
  • 使用数据库系统可以减轻数据库系统管理人员维护系统的负担。因为 DBMS 在数据库建立、运用和维护时对数据库进行统一的管理和控制,包括数据的完整性、安全性、多用户并发控制、故障恢复等,都由 DBMS 执行。
  • 总之,使用数据库系统的优点是很多的,既便于数据的集中管理,控制数据冗余,提高数据的利用率和一致性,又有利于应用程序的开发和维护。读者可以在自己今后的工作中结合具体应用,认真加以体会和总结。
  1. 试述文件系统与数据库系统的区别和联系。
  • 答:文件系统与数据库系统的区别是:文件系统面向某一应用程序,共享性差,冗余度大,数据独立性差,记录内有结构,整体无结构,由应用程序自己控制。数据库系统面向现实世界,共享性高,冗余度小,具有较高的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据的安全性、完整性、并发控制和恢复能力。
  • 文件系统与数据库系统的联系是:文件系统与数据库系统都是计算机系统中管理数据的软件,数据库中数据的组织和存储是通过操作系统中的文件系统来实现的。
  • 解析:文件系统是操作系统的重要组成部分,而DBMS是独立于操作系统的软件,但是 DBMS是在操作系统的基础上实现的。
  1. 举出适合用文件系统而不是数据库系统的例子;再举出适合用数据库系统的应用例子。
  • 答 : (1)适用于文件系统而不是数据库系统的应用例子:数据的备份、软件或应用程序使用过程中的临时数据存储一般使用文件比较合适。早期功能比较简单、比较固定的应用系统也适合用文件系统。
  • ( 2 )适用于数据库系统而非文件系统的应用例子:目前,几乎所有企业或部门的信息系统都以数据库系统为基础,都使用数据库。例如,一个工厂的管理信息系统(其中会包括许多子系统,如库存管理系统、物资采购系统、作业调度系统、设备管理系统、人事管理系统等),学校的学生管理系统,人事管理系统,图书馆的图书管理系统,等等,都适合用数据库系统。希望读者能举出自己了解的应用例子。
  1. 试述数据库系统的特点。
  • 答:数据库系统的主要特点有:
  • (1)数据结构化。数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
  • 解析:注意这里的“整体”两字。在数据库系统中,数据不再针对某一个应用,而是面向全组织,具有整体的结构化。不仅数据是结构化的,而且数据的存取单位即一次可以存取数据的大小也很灵活,可以小到某一个数据项(如一个学生的姓名),大到一组记录(成千上万个学生记录)。而在文件系统中,数据的存取单位只有一个:记录,如一个学生的完整记录。
  • (2)数据的共享性高,冗余度低,易扩充。数据库的数据不再面向某个应用而是面向整个系统,因此可以被多个用户、多个应用以多种不同的语言共享使用。由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大,易于扩充。
  • 解析:数据共享可以大大减少数据冗余,节约存储空间,同时还能够避免数据之间的不相容性与不一致性。所谓“数据面向某个应用”是指数据结构是针对某个应用设计的,只被这个应用程序或应用系统使用,可以说数据是某个应用的“私有资源”。所谓“弹性大”是指系统容易扩充也容易收缩,即应用增加或减少时不必修改整个数据库的结构,只需做很少的改动。可以取整体数据的各种子集用于不同的应用系统,当应用需求改变或增加时,只要重新选取不同的子集或加上一部分数据,便可以满足新的需求。
  • (3)数据独立性高。数据独立性包括数据的物理独立性和数据的逻辑独立性。数据库管理系统的模式结构和二级映像功能保证了数据库中的数据具有很高的物理独立性和逻辑独立性。
  • (4)数据由DBMS统一管理和控制。数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中同一个数据。为此,DBMS必须提供统一的数据控制功能,包括数据的安全性保护、数据的完整性检查、并发控制和数据库恢复。
  • 解析:DBMS数据控制功能包括四个方面:
  • (1)数据的安全性保护:保护数据以防止不合法的使用造成的数据的泄密和破坏;
  • (2)数据的完整性检查:将数据控制在有效的范围内,或保证数据之间满足一定的关系;
  • (3)并发控制:对多用户的并发操作加以控制和协调,保证并发操作的正确性;
  • (4)数据库恢复:当计算机系统发生硬件故障、软件故障,或者由于操作员的失误以及故意的破坏影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失时,能将数据库从错误状态恢复到某一已知的正确状态(亦称为完整状态或一致状态)。

下面可以得到“什么是数据库”的一个定义:数据库是长期存储在计算机内有组织的大量的共享的数据集合,它可以供各种用户共享,具有最小冗余度和较高的数据独立性。DBMS在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对系统进行恢复。数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。

  1. 数据库管理系统的主要功能有哪些?

答:(1)数据定义功能;

(2)数据组织、存储和管理;

(3)数据操纵功能;

(4)数据库的事务管理和运行管理;

(5)数据库的建立和维护功能;

(6)其它功能。

  1. 什么是概念模型?试述概念模型的作用。

答:概念模型,也称信息模型,是按用户的观点来对数据和信息建模,主要用于数据库设计。

概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。

  1. 定义并解释概念模型中以下术语:实体,实体型,实体集,实体之间的联系。

答:实体:客观存在并可以相互区分的事物叫实体。

实体型:具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。

实体集:同型实体的集合称为实体集。

实体之间的联系:通常是指不同实体型的实体集之间的联系,实体之间的联系有一对一,一对多和多对多等多种类型。

9 .试述数据模型的概念、数据模型的作用和数据模型的三个要素。

答:概念:数据模型是对现实世界数据特征的抽象,通俗地讲数据模型就是现实世界的模拟。

作用:数据模型是用来描述数据、组织数据和对数据进行操作的。数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式构架。

三要素:数据模型描述了系统的静态特性、动态特性和完整性约束条件,因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。

(1)数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。

(2)数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。

(3)数据的约束条件:是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。

解析:数据模型是数据库系统中最重要的概念之一。必须通过 《 概论 》 的学习真正掌握数据模型的概念和作用。数据模型是数据库系统的基础。任何一个 DBMS 都以某一个数据模型为基础,或者说支持某一个数据模型。数据库系统中,模型有不同的层次。根据模型应用的不同目的,可以将模型分成两类或者说两个层次:一类是概念模型,是按用户的观点来对数据和信息建模,用于信息世界的建模,强调语义表达能力,概念简单清晰;另一类是数据模型,是按计算机系统的观点对数据建模,用于机器世界,人们可以用它定义、操纵数据库中的数据,一般需要有严格的形式化定义和一组严格定义了语法和语义的语言,并有一些规定和限制,便于在机器上实现。

 

12 .试述网状、层次数据库的优缺点。

答:

层次模型的优点主要有:

( 1 )模型简单,对具有一对多层次关系的部门描述非常自然、直观,容易理解,这是层次数据库的突出优点;

( 2 )用层次模型的应用系统性能好,特别是对于那些实体间联系是固定的且预先定义好的应用,采用层次模型来实现,其性能优于关系模型;

( 3 )层次数据模型提供了良好的完整性支持。

层次模型的缺点主要有:

( 1 )现实世界中很多联系是非层次性的,如多对多联系、一个结点具有多个双亲等,层次模型不能自然地表示这类联系,只能通过引入冗余数据或引入虚拟结点来解决;

( 2 )对插入和删除操作的限制比较多;

( 3 )查询子女结点必须通过双亲结点。

 

网状数据模型的优点主要有:

( 1 )能够更为直接地描述现实世界,如一个结点可以有多个双亲;

( 2 )具有良好的性能,存取效率较高。

网状数据模型的缺点主要有:

(1)结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;

( 2 )其 DDL 、 DML 语言复杂,用户不容易使用。由于记录之间联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径。因此,用户必须了解系统结构的细节,加重了编写应用程序的负担。

 

13.试述关系模型的概念,定义并解释以下术语:

( 1 )关系 ( 2 )属性( 3 )域( 4 )元组 ( 5 )主码( 6 )分量( 7 )关系模式

答:

关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

(1)关系:一个关系对应通常说的一张表;

( 2 )属性:表中的一列即为一个属性;

( 3 )域:属性的取值范围;

( 4 )元组:表中的一行即为一个元组;

( 5 )主码:表中的某个属性组,它可以惟一确定一个元组;

( 6 )分量:元组中的一个属性值;

( 7 )关系模式:对关系的描述,一般表示为关系名(属性 1 ,属性 2 , „ ,属性 n )

 

14 .试述关系数据库的特点。

答:

关系数据模型具有下列优点:

(1)关系模型与非关系模型不同,它是建立在严格的数学概念的基础上的。

( 2 )关系模型的概念单一,无论实体还是实体之间的联系都用关系表示,操作的对象和操作的结果都是关系,所以其数据结构简单、清晰,用户易懂易用。

( 3 )关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。

当然,关系数据模型也有缺点,其中最主要的缺点是,由于存取路径对用户透明,查询效率往往不如非关系数据模型。因此为了提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。

 

15.试述数据库系统三级模式结构,这种结构的优点是什么?

答:

数据库系统的三级模式结构由外模式、模式和内模式组成。(参见书上图 1 . 29 )

外模式,亦称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。

模式,亦称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式描述的是数据的全局逻辑结构。外模式涉及的是数据的局部逻辑结构,通常是模式的子集。

内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。

数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑抽象地处理数据,而不必关心数据在计算机中的表示和存储。为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。

 

16 .定义并解释以下术语:模式、外模式、内模式、 DDL 、 DML 。

答:

见上题。

DDL :数据定义语言,用来定义数据库模式、外模式、内模式的语言。

DML :数据操纵语言,用来对数据库中的数据进行查询、插入、删除和修改的语句。

 

17.什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?

答:

数据与程序的逻辑独立性:当模式改变时(例如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式/模式的映像做相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

数据与程序的物理独立性:当数据库的存储结构改变了,由数据库管理员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。

数据库管理系统在三级模式之间提供的两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。

 

18 .试述数据库系统的组成。

答:

数据库系统一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。

 

19 .数据库管理员、系统分析员、数据库设计人员、应用程序员的职责是什么?

答:数据库管理员的职责:

(1)决定数据库中的信息内容和结构;

(2)决定数据库的存储结构和存取策略;

(3)定义数据的安全性要求和完整性约束条件;

(4)监控数据库的使用和运行;

(5)数据库的改进和重组、重构。

 

系统分析员负责应用系统的需求分析和规范说明,系统分析员要和用户及DBA相结合,确定系统的硬件、软件配置,并参与数据库系统的概要设计。

数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。数据库设计人员必须参加用户需求调查和系统分析,然后进行数据库设计。在很多情况下,数据库设计人员就由数据库管理员担任。

应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。

posted @   hstxmgzY  阅读(18)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示