空间数据库复习笔记

一、空间数据库绪论

1. 空间数据库定义

空间数据库是描述与特定空间位置关系有关的真实世界对象的数据集合。

2. 空间数据特征

空间特征、时间特征和专题属性特征。

3. 空间数据库系统组成

存储系统、管理系统、应用系统。

4. 空间数据库特征

1、数据量庞大。

空间数据库面向的是地理学及其相关对象,而在客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的数据容量很大,容量通常达到 GB级。

2、具有高可访问性 。

空间信息系统要求具有强大的信息检索和分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。

3、空间数据模型复杂

空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的数据类型,这些数据类型主要可以分为 3 类:

(1)属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。

(2)图形图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。

(3)空间关系数据:存储拓扑关系的数据,通常与图形数据是合二为一的。

4、属性数据和空间数据联合管理。

5、空间实体的属性数据和空间数据可随时间而发生相应变化。

6、空间数据的数据项长度可变,包含一个或多个对象,需要嵌套记录。

7、一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。

8、具有空间多尺度性和时间多尺度性。

9、应用范围广泛。

二、数据库概论

1. 数据的独立性哪两方面?

逻辑独立性:是指用户的应用程序与数据库的逻辑结构是相互独立的,即,当数据的逻辑结构改变时,用户程序也可以不变。数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由DBMS负责,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。

物理独立性:是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。即数据在磁盘上怎样存储由DBMS(Database Management System 数据库管理系统)管理,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。

2. 数据模型定义和分类

定义:用来描述数据、组织数据和对数据进行操作,是对现实世界数据特征的描述。

分类:概念模型,结构模型(层次结构,网状结构,关系结构),物理模型

3. 数据模型三要素

  • 数据结构

  • 数据操作

  • 数据约束

5. 数据库三级模式,二级映像,模式、外模式、内模式定义

为了提高数据的物理独立性和逻辑独立性,使数据库的用户观点与数据库的物理方面区分开来,采用三级模式结构,并提供两级映像功能。

模式是数据库中全体数据的逻辑结构特征的描述。

外模式也称子模式用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图。

内模式又称存储模式或内视图,是三级结构中的最内层,也是靠近物理存储的一层,由多个存储记录组成。

6. 三级模式的优点

数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑地、抽象地处理数据,而不必关心数据在计算机中的具体表示方式与存储方式。

7. 数据库系统的组成

数据库系统一般由数据库软件硬件应用程序员数据库管理员以及数据库系统用户构成。

三、关系数据库

1. 关系模型三个组成部分

  • 关系数据结构

  • 关系操作集合

  • 关系完整性约束

2. 名词解释

候选键:可以唯一的决定某个元组的属性组,属性组中各属性缺一不可

主键: 用户选作元组标识的一个候选键称为主键

主属性 :候选键中的属性为主属性

非主属性:除主属性以外的属性为非主属性

全码:包含所有属性的码称为全码

外键:在一个表中不是主键的键,在另一个表中是主键。

3. 关系完整性定义、 三个组成部分及其各自定义

关系完整性定义:关系完整性约束是为保证数据库中数据的正确性和相容性,对关系模型提出的某种约束条件或规则。

实体完整性:主键不能为空或重复

参照完整性:在参照关系中,任意元组在特定关系上的取值必然等于被参照关系中某个元素在特性关系上的取值

用户自定义完整性:用户定义完整性是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。

4. 等值连接与自然连接的区别

等值连接必须要有等值的条件,当条件不同时连接的结果也不相同,两个关系可以没有相同的属性列

自然连接必须要有相同的属性列才能进行,即等值连接之后要去除相同的属性列

四、SQL 语言

1. 基本表

基本表是本身独立存在的表,在SQL中一个关系就对应一个表。

2. 视图的定义

由单个或多个基本表导出的虚拟表,表中不存储数据,数据存储在虚拟表中。

3. 视图的优点

优点是利于数据保密,简化了查询操作,保证数据的逻辑性。

3. 连接的类别及各自定义

内连接:去掉所有悬浮元组

左外连接:保留左表的悬浮元组

右外连接:保留右表的悬浮元组

全外连接:保留所有悬浮元组

普通子查询与相关子查询

普通子查询:子查询先执行,得到结果后传给父查询。

相关子查询:子查询需要父查询的结果才能执行,所以叫相关子查询。

五、数据库规范化理论

1. 函数依赖

函数依赖函数依赖是关系模式属性之间的一种逻辑依赖关系

完全函数依赖:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’!→Y,则称Y完全函数依赖于X。

部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y部分函数依赖于X。

传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→Y(Y !→X),Y→Z,则称Z传递函数依赖于X。

2. 数据库的范式

3. 多值依赖关系模式的规范化

4NF解决

4. 关系模式的规范化

规范化的基本思想是逐步消除数据依赖中不合适的部分,使模式中的各关系模式达到某种程度的“分离”

5. 名词解释

超码super key

形式:一个或多个属性的集合 作用:在一个关系中唯一地标识一个元组。 特点:

  • 可能包含无关属性

  • 超码的任意超集也是超码。(通俗讲,就是同一个关系r上,如果某个属性集合S包含超码K,即K是S的子集,那么S也是 r 的超码)

  • 一张表(一个关系)一定有超码,因为至少所有属性的组合一定是超码,能唯一确定一个元组

  • 不唯一

候选码candidate key

形式:一个或多个属性的集合 作用:在一个关系中唯一地标识一个元组。 特点:

  • 是超码的一个子集

  • 任意真子集都不可能是超码,候选码就是最小的超码

  • 没有无关属性

  • 不唯一

主码primary key

形式:一个或多个属性的集合 作用:在一个关系中唯一地标识一个元组。 特点:

  • 是候选码之一

  • 唯一或没有

  • 由数据库设计者指定,不指定的话表就没有主码

主属性:一个属性只要在任何一个候选码中出现过,这个属性就是主属性。

全码:如果一个码包含了所有的属性,这个码就是全码。

六、数据库设计

1. 数据库设计步骤简述

需求分析:是整个设计过程的基础,进行数据库设计首先必须准确了解与分析用户需求(包括数据与处理)。

概念结构设计:是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成一个独立于具体数据库管理系统的概念模型。

逻辑结构设计:是将概念结构转换为某个数据库管理系统所支持的数据模型,并对其进行优化。

物理结构实施:是为逻辑数据模型选取一个最合适应用环境的物理结构(包括存储结构和存取方法)。

数据库的实施:设计人员运用数据库管理系统提供的数据库语言及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编写与调试应用程序,组织数据入库,并进行试运行。

数据库的运行与维护:数据库运行和维护:在数据库系统运行过程中必须不断地对其进行评估、调整与修改。

2. 数据字典定义、包含内容

定义:数据字典是系统中各类数据描述集合

数据项数据流数据结构数据存储处理过程五个部分

3. E-R 方法与E-R 图

E-R图的基本思想就是分别用矩形框椭圆形框菱形框表示实体属性联系,使用无向边将属性与其相应的实体连接起来,并将联系分别和有关实体相连接,注明联系类型。

4. 游标定义及作用

游标是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果,用户可以通过游标逐一获取记录并赋给主变量,交由主语言进一步处理。

5. 存储过程定义、分类、优点

定义:存储过程是为了完成特定的功能而汇集成一组的SQL语句集

分类:

  • 系统存储过程

  • 本地存储过程

  • 临时存储过程

  • 远程存储过程

  • 扩展存储过程

优点:

  • 运行效率高。

  • 降低了客户机和服务器之间的通信量。

  • 方便实施企业规则。

6. 存储过程与函数的区别

存储过程用户在数据库中完成特定操作或者任务(如插入,删除等),函数用于返回特定的数据。

存储过程不需要返回类型,函数必须要返回类型。

SQL语句(DML或SELECT)中不可用调用存储过程,而函数可以。

7. 触发器的定义、作用、分类

触发器是一种特殊类型的存储过程,也是使用SQL语句编写的程序,当对数据库做修改时,它被系统自动执行。

触发语句 old new
Insert 所有字段都是空(null) 将要插入的数据
Update 更新以前该行的值 更新后的值
delete 删除以前该行的值 所有字段都是空(null)触发语句

七、空间索引

1. 空间索引定义

空间索引是指在存储空间数据时依据空间对象的位置和形状空间对象之间的某种空间关系,按一定顺序排列的一种数据结构。

2. B 树家族总结

B-树

多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键

字范围的子结点;

所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;

B+树

在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点

中出现,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中;

B*树

在B+树基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3;

3. 网格索引

基本思想是将研究区域用横竖线条划分大小相等和不等的格网,每个网格可视为一个桶,它记录了落入每一个格网区域内的空间实体编号。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。

4. 四叉树索引

四叉树索引就是为了实现要素真正被网格分割、同时保证桶内要素不超过某一个量而提出的一种空间索引方法。

四叉树索引首先将整个数据空间分割成为四个相等的矩形,四个不同的矩形分别对应西北( NW )、东北(NE)、西南(SW)、东南( SE )四个象限;若每个象限内包含的要素不超过给定的桶量则停止,否则对超过桶量的矩形再按同样的方法进行划分,直到桶量满足要求或不会再减少为止,最终形成一颗有层次的四叉树。

5. 四叉树、R树定义

四叉树索引的基本思想是将地理空间递归划分为不同层次的树结构。

R树就是一棵用来存储高维数据的平衡树。

6. 空间填充曲线、分类

从数学的角度上看,可以将空间填充曲线看成是一种把N维空间数据转换到1维连续空间上的映射函数。

Z曲线,希尔伯特曲线

7. MBR

最小外接矩形是指以二维坐标表示的若干二维形状(例如点、 直线 、 多边形 )的最大范围,即以给定的二维形状各顶点中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标定下边界的矩形。

八、空间数据类型

Geometry:支持平面或欧几里得(平面球)数据,适用于 SQL 规范的开放地理空间联盟 (OGC) 简单特征 1.1.0 版。

Geography:可存储诸如 GPS 纬度和经度坐标之类的椭圆体(圆球)数据。

geometry 和 geography 数据类型支持11种空间数据对象或实例类型。但是,这些实例类型中只有7种“可实例化”。

这些实例的某些属性由其父级数据类型派生而来,使其在 Geometry Collection 中区分为 Points、 LineStrings、Polygons 或多个 geometry 或 geography 实例。

 

九、数据库连接

1. 数据库连接方式

OLEDB,ODBC,ADO,ADO.NET,LINQ、JDBC

2. C#连接数据库

Connection 对象是一个连接对象,主要功能是建立与物理数据库的连接,其主要包括4种访问数据库的对象类,也可称为数据提供程序,分别介绍如下:

SQL Server Connection

Oracle Connection

ODBC Connection

OLEDB Connection

连接方式:

  1. 用户名密码连接

  2. 配置文件连接

  3. 工厂连接

 

posted @ 2022-06-21 23:10  Weltㅤ  阅读(330)  评论(0编辑  收藏  举报