1、数据库系统概论编
概论
1.1 数据库的地位
- 数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支。
- 数据库技术是信息系统的核心和基础它的出现极大地促进了计算机应用向各行各业的渗透。
- 数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志。
1.2 数据库的四个基本概念
- 数据:
-
数据 (Data) 是数据库中存储的基本对象。
-
数据的定义:是用来描述事物的符号。
数字、字符串、日期、逻辑值、文本、图形、图象、声音这些都是数据。不同的数据用不同的符号来描述。
-
数据的特点:数据与其语义是不可分的。
列如:一个学生是1996年出生的,这里1996年的语义表示的就是出生年份。单单把1996拿出来就没有语义,别人就不知道是什么意思。在存储一个数字93作为数据,但没有提供语义,别人就不知道93是什么意思,它有可能是:学生某门课的成绩、某人的体重、某班的人数等等。所以需要提供语义。
-
一个完整的数据:
李明,男,197205,江苏南京市,计算机系,1990
语义:学生姓名、性别、出生年月、籍贯、所在院系、入学时间
解释:李明是个大学生,1972年5月出生,江苏南京市人,1990年考入计算机系
-
数据库:
- 数据库 (Database, 简称 DB) 是长期储存在计算机内、有组织的、可共享的数据集合。
- 数据库的基本特征:
- 数据按一定的数据模型组织、描述和储存
- 可为各种用户共享
- 冗余度较小
- 数据独立性较高
- 易扩展
-
数据库管理系统:
- 数据库管理系统( Database ManagementSystem ,简称 DBMS )是位于用户与操作系统之间的一层数据管理软件。
- DBMS 的用途
– 科学地组织和存储数据、高效地获取和维护数据 - DBMS 的主要功能:
- 数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象 - 数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率 - 数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改) - 数据库的事务管理和运行管理
数据库在建立、运行和维护时由DBMS统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复 - 数据库的建立和维护功能(实用程序)
数据库初始数据装载转换
数据库转储
介质故障恢复
数据库的重组织
性能监视分析等 - 其它功能
DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作
- 数据定义功能
-
数据库系统:
- 什么是数据库系统(Database System,简称DBS)
在计算机系统中引入数据库后的系统构成
-
数据库系统的构成:
- 数据库
- 数据库管理工具(及其应用开发工具)
- 应用程序
- 数据库管理员(dba)
1.3 数据管理技术的产生和发展
1.3.1 什么是数据管理
-
对数据进行分类、组织、编码、存储、检索和维护
-
数据处理的中心问题
1.3.2 数据管理技术的发展过程
-
人工管理阶段(20世纪40年代中–50年代中)
- 产生的背景:
- 应用需求:科学计算
- 硬件水平:无直接存取存储设备
- 软件水平:没有操作系统
- 处理方式:没有共享、大家想要同一份数据需要进行批处理,每个人复制一份。
- 特点:
- 数据的保存:应用程序,数据不保存。
- 数据面向的对象:某个单一的应用程序
- 数据的共享程度:无共享、冗余度极大
- 数据的独立性:数据和应用程序不独立
- 数据的结构化:无结构
- 数据控制能力:应用程序自己控制
- 产生的背景:
-
文件系统阶段(20世纪50年代末–60年代中)
- 产生的背景:
- 应用需求:科学计算、管理
- 硬件水平:磁盘、磁鼓
- 软件水平:有文件系统进行管理
- 处理方式:联机实时处理、批处理,有一定的共享能力
- 特点:
-
数据的保存:文件系统,数据可长期保存、按文件名访问,按记录存取。
-
数据面向的对象:某个单一的应用程序
-
数据的共享程度:共享差、冗余度大
-
数据的独立性:独立性差
-
数据的结构化:记录内有结构 , 整体无结构
记录内有结构:在进行存储的时候,只有当前的内容有结构,跟其他内容不能够联系起来。 列如:a老师有:姓名、性别、身高等信息结构,但跟他有关联的b学生的信息结构不能体现出联系关系,两者之间相互独立的。
-
数据控制能力:应用程序自己控制
-
- 产生的背景:
-
数据库系统阶段(20世纪60年代末–现在)
- 产生的背景:
- 应用需求:大规模管理
- 硬件水平:大容量磁盘
- 软件水平:有数据库管理系统
- 处理方式:联机实时处理 , 分布处理 , 批处理
- 特点:
-
数据的保存:文件系统,数据可长期保存、使用DBMS进行管理。
-
数据面向的对象:对现实世界的模拟来进行存储数据
-
数据的共享程度:共享高、冗余度小
数据的高共享性的好处: 降低数据的冗余度,节省存储空间 避免数据间的不一致性,使系统易于扩充。
-
数据的独立性:高度的物理独立性和一定的逻辑独立性
物理独立性 指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。 当数据的物理存储改变了,应用程序不用改变。 比如:数据原本存储在机械硬盘现在搬迁到固态硬盘,两者的存储逻辑变了,程序不用为了这个改变而改变代码。 逻辑独立性 指用户的应用程序与数据库的逻辑结构是相互独立的。 数据的逻辑结构改变了,用户程序也可以相对不变 比如:字段的类型变了,字段变长了,用户程序也可以相对不变。
-
数据的结构化:整体结构化
整体数据的结构化是数据库的主要特征之一 数据库中实现的是数据的真正结构化 – 数据的结构用数据模型描述,无需程序定义和解释。 – 数据可以变长。 – 数据的最小存取单位是数据项。 列如:一个老师带多少个学生,多少个班级,这样的一对多关系结构模型是可以在数据库中体现出来的。老师带领的学生和班级这些数据是可以变长的,在读取a老师带的b学生时,可以完整的读取到b学生的姓名、学号、性别等各个属性(数据项),一个数据项是由其他各个数据元素结合起来的。
-
数据控制能力:由 DBMS 统一管理和控制
DBMS提供的数据控制功能 (1)数据的安全性(Security)保护· 保护数据,以防止不合法的使用造成的数据的泄密和破坏。 (2)数据的完整性(Integrity)检查 将数据控制在有效的范围内,或保证数据之间满足一定的关系。 (3)并发(Concurrency)控制 对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。 (4)数据库恢复(Recovery) 将数据库从错误状态恢复到某一已知的正确状态。
-
- 产生的背景:
1.3.3 数据管理技术的发展动力
- 应用需求的推动
- 计算机硬件的发展
- 计算机软件的发展