『数据库』朴实无华的数据库绪论
『数据库』 朴实无华且枯燥的数据库教程–入门必看!(不收藏,真的吃亏了)
数据库系统概述
一、四个基本概念
1.数据(Data):数据是数据库中存储的基本对象
1)定义:描述事物的符号记录
2)种类:文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等
3)特点:数据与其语义是不可分的
2.数据库(Database):
1)定义:数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。
2)基本特征:
- 数据按一定的数据模型组织、描述和储存
- 可为各种用户共享
- 冗余度较小
- 数据独立性较高
- 易扩展
3.数据库管理系统(DBMS)
1)定义:
位于用户与操作系统之间的一层数据管理软件。
是基础软件,是一个大型复杂的软件系统
2)用途:
科学地组织和存储数据、高效地获取和维护数据
3)功能:
-
数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象 -
数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率 -
数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改)
数据库的事务管理和运行管理
数据库在建立、运行和维护时由DBMS统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复 -
数据库的建立和维护功能(实用程序)
数据库初始数据装载转换
数据库转储
介质故障恢复
数据库的重组织
性能监视分析等 -
其它功能
DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作
4.数据库系统(DBS)
1)定义:
在计算机系统中引入数据库后的系统构成
2)构成:
- 数据库
- 数据库管理系统(及其开发工具)
- 应用系统
- 数据库管理员
5.数据与信息
数据是信息的载体
信息是数据的内涵
6.i数据的分类
- 格式化数据:EXCEL表格,XML;THML;文件格式;特殊约定的格式
- 非格式化的数据:语言,音频,视频
二、数据管理技术的产生和发展
1.什么是数据管理
对数据进行分类、组织、编码、存储、检索和维护
数据处理的中心问题
2.数据管理技术的发展过程
1)动力:应用需求的推动;计算机硬件的发展;计算机软件的发展
2)人工管理阶段(20世纪40年代中–50年代中):
A.背景:
应用需求——科学计算
硬件水平——无直接存取存储设备
软件水平——没有操作系统
处理方式——批处理
B.特点:
数据的管理者:用户(程序员),数据不保存
数据面向的对象:某一应用程序
数据的共享程度:无共享、冗余度极大
数据的独立性:不独立,完全依赖于程序
数据的结构化:无结构
数据控制能力:应用程序自己控制
3)文件系统阶段(20世纪50年代末–60年代中)
A.背景:
应用需求——科学计算、管理
硬件水平——磁盘、磁鼓
软件水平——有文件系统
处理方式——联机实时处理、批处理
B.特点:
数据的管理者:文件系统,数据可长期保存
数据面向的对象:某一应用程序
数据的共享程度:共享性差、冗余度大
数据的结构化:记录内有结构,整体无结构
数据的独立性:独立性差,数据的逻辑结构改变必须
修改应用程序
数据控制能力:应用程序自己控制
C.文件系统中数据的结构:
记录内有结构
数据的结构是靠程序定义和解释的
文件间是独立的,因此数据整体无结构
可以间接实现数据整体的有结构,但必须在应用程序中描述数据间的联系
数据的最小存取单位是记录
4)数据库系统阶段(20世纪60年代末–现在)
A.背景:
应用背景——大规模管理
硬件背景——大容量磁盘、磁盘阵列
软件背景——有数据库管理系统
处理方式——联机实时处理,分布处理,批处理
3.数据库系统的特点
1)数据结构化
2)数据的共享性高,冗余度低,易扩充
3)数据独立性高
4)数据由DBMS统一管理和控制
数据模型
在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
通俗地讲数据模型就是现实世界的模拟。
数据模型应满足三方面要求:能比较真实地模拟现实世界;容易为人所理解;便于在计算机上实现
一、.两类数据模型
1. 概念模型:也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
2.逻辑模型和物理模型
1)逻辑模型:主要包括网状模型、层次模型、关系模型、面向对象模型等,按计算机系统的观点对数据建模,用于DBMS实现。
2)物理模型:是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
客观对象的抽象过程—两步抽象
现实世界中的客观对象抽象为概念模型;
把概念模型转换为某一DBMS支持的数据模型。
二、数据模型的组成要素
1.数据结构:
1)定义:描述数据库的组成对象,以及对象之间的联系
2)内容:
与数据类型、内容、性质有关的对象
与数据之间联系有关的对象
3)数据结构是对系统静态特性的描述
2.数据操作
1)定义:对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则
2)类型:
查询
更新(包括插入、删除、修改)
3)数据模型对操作的定义
操作的确切含义
操作符号
操作规则(如优先级)
实现操作的语言
4)数据操作是对系统动态特性的描述
3.数据的完整性约束条件
1)数据的完整性约束条件
一组完整性规则的集合。
完整性规则:给定的数据模型中数据及其联系所具有的制约和储存规则
用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
2)数据模型对完整性约束条件的定义
反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。
提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
概念模型
一、信息世界中的基本概念
1. 实体(Entity)
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
2.属性(Attribute)
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
3.码(Key)
唯一标识实体的属性集称为码。
4. 域(Domain)
属性的取值范围称为该属性的域。
5.实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为实体型
6.实体集(Entity Set)
同一类型实体的集合称为实体集
7.联系(Relationship)
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系
二、两个实体型之间的联系
1.一对一联系(1:1)
如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1 。
2.一对多联系(1:n)
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:n。
3.多对多联系(m:n)
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系,记为m:n
三、两个以上实体型之间的联系
1.两个以上实体型之间一对多联系
若实体集E1,E2,…,En存在联系,对于实体集Ej(j=1,2,…,i-1,i+1,…,n)中的给定实体,最多只和Ei中的一个实体相联系,则我们说Ei与E1,E2,…,Ei-1,Ei+1,…,En之间的联系是一对多的
2.两个以上实体型间的多对多联系
四、单个实体型内的联系
1.一对多联系
2.一对一联系
3.多对多联系
五、 概念模型的一种表示方法
1.实体-联系方法(E-R方法)
用E-R图来描述现实世界的概念模型
E-R方法也称为E-R模型
1)实体型
用矩形表示,矩形框内写明实体名。
2)属性
用椭圆形表示,并用无向边将其与相应的实体连接起来
3)联系
用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)
联系的属性:
联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来
四、最常用的数据模型
1.非关系模型
1)层次模型(Hierarchical Model)
层次模型是数据库系统中最早出现的数据模型
层次模型用树形结构来表示各类实体以及实体间的联系
条件:
- 有且只有一个结点没有双亲结点,这个结点称为根结点
- 根以外的其它结点有且只有一个双亲结点
特点:
- 结点的双亲是唯一的
- 只能直接处理一对多的实体联系
- 每个记录类型可以定义一个排序字段,也称为码字段
- 任何记录值只有按其路径查看时,才能显出它的全部意义
- 没有一个子女记录值能够脱离双亲记录值而独立存在
层次模型的完整性约束条件:
- 无相应的双亲结点值就不能插入子女结点值
- 如果删除双亲结点值,则相应的子女结点值也被同时删除
- 更新操作时,应更新所有相应记录,以保证数据的一致性
层次数据模型的存储结构
- 邻接法
- 链接法:子女-兄弟链接法;层次序列链接法
优点
- 层次模型的数据结构比较简单清晰
- 查询效率高,性能优于关系模型,不低于网状模型
- 层次数据模型提供了良好的完整性支持
缺点
- 多对多联系表示不自然
- 对插入和删除操作的限制多,应用程序的编写比较复杂
- 查询子女结点必须通过双亲结点
- 由于结构严密,层次命令趋于程序化
2)网状模型(Network Model)
网状数据库系统采用网状模型作为数据的组织方式
条件:
- 允许一个以上的结点无双亲
- 一个结点可以有多于一个的双亲
表示方法
实体型:用记录类型描述每个结点表示一个记录类型(实体)
属性:用字段描述每个记录类型可包含若干个字段
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系
网状模型与层次模型的区别
- 网状模型允许多个结点没有双亲结点
- 网状模型允许结点有多个双亲结点
- 网状模型允许两个结点之间有多种联系(复合联系)
- 网状模型可以更直接地去描述现实世界
- 层次模型实际上是网状模型的一个特例
多对多联系在网状模型中的表示:将多对多联系直接分解成一对多联系
网状模型完整性约束
码:唯一标识记录的数据项的集合
一个联系中双亲记录与子女记录之间是一对多联系
支持双亲记录和子女记录之间某些约束条件
网状模型存储常用方法
- 单向链接
- 双向链接
- 环状链接
- 向首链接
优点
- 能够更为直接地描述现实世界,如一个结点可以有多个双亲
- 具有良好的性能,存取效率较高
缺点
- 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变
- 得越来越复杂,不利于最终用户掌握
- DDL、DML语言复杂,用户不容易使用
2.关系模型(Relational Model)
关系数据库系统采用关系模型作为数据的组织方式
关系数据模型的数据结构
1)关系(Relation)
一个关系对应通常说的一张表
2)元组(Tuple)
表中的一行即为一个元组
3)属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名
4)主码(Key)
表中的某个属性组,它可以唯一确定一个元组。
5)域(Domain)
属性的取值范围。
6)分量
元组中的一个属性值。
7)关系模式
对关系的描述
8)关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系,年级)
关系模式最基本的规范条件:关系的每一个分量必须是一个不可分的数据项, 不允许表中还有表
关系的完整性约束条件
- 实体完整性
- 参照完整性
- 用户定义的完整性
优点
- 建立在严格的数学概念的基础上
- 概念单一
实体和各类联系都用关系来表示
对数据的检索结果也是关系 - 关系模型的存取路径对用户透明
具有更高的数据独立性,更好的安全保密性
简化了程序员的工作和数据库开发建立的工作
缺点
- 存取路径对用户透明导致查询效率往往不如非关系数据模型
- 为提高性能,必须对用户的查询请求进行优化增加了开发DBMS的难度
3.面向对象模型(Object Oriented Model)
4.对象关系模型(Object Relational Model)
数据库系统结构
1.从数据库管理系统角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构
2.从数据库最终用户角度看(数据库系统外部的体系结构) ,数据库系统的结构分为:
- 单用户结构
- 主从式结构
- 分布式结构
- 客户/服务器
- 浏览器/应用服务器/数据库服务器多层结构等
一、数据库系统模式的概念
1.“型” 和“值” 的概念
型(Type)
对某一类数据的结构和属性的说明
值(Value)
是型的一个具体赋值
模式(Schema)
数据库逻辑结构和特征的描述
是型的描述
反映的是数据的结构及其联系
模式是相对稳定的
实例(Instance)
模式的一个具体值
反映数据库某一时刻的状态
同一个模式可以有很多实例
实例随数据库中的数据的更新而变动
二、数据库系统的三级模式结构
1.模式(Schema)
- 模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述
所有用户的公共数据视图,综合了所有用户的需求 - 一个数据库只有一个模式
- 模式的地位:是数据库系统模式结构的中间层
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关
定义
- 数据的逻辑结构(数据项的名字、类型、取值范围等)
- 数据之间的联系
- 数据有关的安全性、完整性要求
2.外模式(External Schema)
-
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
-
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
用途 -
保证数据库安全性的一个有力措施
-
每个用户只能看见和访问所对应的外模式中的数据
3.内模式(Internal Schema)
- 是数据物理结构和存储方式的描述
- 是数据在数据库内部的表示方式
- 一个数据库只有一个内模式
三、数据库的二级映像功能与数据独立性
- 三级模式是对数据的三个抽象级别
- 二级映象在DBMS内部实现这三个抽象层次的联系和转换
外模式/模式映像
模式/内模式映像
1.外模式/模式映象
- 模式:描述的是数据的全局逻辑结构
- 外模式:描述的是数据的局部逻辑结构
- 同一个模式可以有任意多个外模式
- 每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
- 映象定义通常包含在各自外模式的描述中
2.模式/内模式映象
- 模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
- 数据库中模式/内模式映象是唯一的
- 该映象定义通常包含在模式描述中
数据库系统的组成
一、数据库
1.硬件平台及数据库
(1) 足够大的内存
操作系统
DBMS的核心模块
数据缓冲区
应用程序
(2) 足够大的外存
磁盘或磁盘阵列
数据库
光盘、磁带
数据备份
(3) 较高的通道能力,提高数据传送率
2.软件
DBMS
支持DBMS运行的操作系统
与数据库接口的高级语言及其编译系统
以DBMS为核心的应用开发工具
为特定应用环境开发的数据库应用系统
3.人员
数据库管理员
系统分析员和数据库设计人员
应用程序员
用户
二、数据库管理系统(及其开发工具)
三、应用系统
四、数据库管理员
- 监控数据库的使用和运行
周期性转储数据库:数据文件;日志文件
系统故障恢复
介质故障恢复
监视审计文件 - 数据库的改进和重组
性能监控和调优
定期对数据库进行重组织,以提高系统的性能
需求增加和改变时,数据库需要重构造
写在最后:
本数据库专栏是由爱吃老谈酸菜的DV一同完成的,博客链接在主页友链,是我的好哥们✈
Name:风骨散人,目前是一名双非在校大学生,预计考研,热爱编程,热爱技术,喜欢分享,知识无界,希望我的分享可以帮到你!名字的含义:我想有一天我能有能力随心所欲不逾矩,不总是向生活低头,有能力让家人拥有富足的生活而不是为了生计而到处奔波。“世人慌慌张张,不过是图碎银几两。偏偏这碎银几两,能解世间惆怅,可让父母安康,可护幼子成长 …”
文章主要内容:
Python,C++,C语言,JAVA,C#等语言的教程
ACM题解、模板、算法等,主要是数据结构,数学和图论
设计模式,数据库,计算机网络,操作系统,计算机组成原理
Python爬虫、深度学习、机器学习
计算机系408考研的所有专业课内容
目前还在更新中,先关注不迷路。微信公众号,cnblogs(博客园),CSDN同名“风骨散人”
如果有什么想看的,可以私信我,如果在能力范围内,我会发布相应的博文!
感谢大家的阅读!😘你的点赞、收藏、关注是对我最大的鼓励!