数据库原理及应用-用户接口及SQL查询语言(Query Language)

2018-02-07 20:41:39

一、DBMS的用户接口

  1. 查询语言
  2. 访问DBMS的访问工具(GUI)
  3. API
  4. 相关类库

 

二、SQL语言

SQL语言可以细分为四种:

1、Data Definition Language (DDL):用来定义,删除或者修改数据模式;

2、Query Language (QL):查询语言

3、Data Manipulation Language (DML):对数据进行插删改操作

4、Data Control Language (DCL):对权限的设置

SQL语言中的一些重要的术语:

1、Base table:基表,就是实实在在存储在磁盘上的关系。

2、View:视图,就是一种虚表,是由基表生成的表。

3、Data type supported:数据类型,各种数据库之间数据类型还是有所差异的。

4、NULL:关键字,空值。由于引入了空值所以布尔表达式变成的三值逻辑,即真假和不知道。

5、UNIQUE:关键字,说明某个属性的值不允许重复。

6、DEFAULT:关键字,为某个属性指定缺省值。

7、PRIMARY KEY:主键

8、FOREIGN KEY:外键

9、CHECK (Integration Constraint):关键字,检查,对某个属性的值进行约束。

一些实例表,下面的举例中会使用到:

 

三、查询语言(Query Language)

1)基本查询语句

从概念上讲,一条这样的查询语句在DBMS里的执行过程是:首先将FROM子句中涉及到的表进行笛卡尔乘积;其次使用WHERE中的布尔表达式进行筛选;接着将筛选出的表根据SELECT子句中的需要的属性进行投影,将不需要的属性去除掉;最后如果加了DISTINCT,则再进行去重。

举个例子:

别名(Range Variables)的使用问题,在不引起混淆的前提下可以不使用别名。不过建议使用别名,尽量规范的写全。

2)表达式和模糊查询

在SELECT子句中可以使用表达式运算,并将运算结果通过‘=’,AS进行属性名的定义;另外,在WHERE子句中可以使用LIKE子句进行字符串的模糊匹配。

3)集合操作,并交差

4)嵌套查询

一种比较简单的嵌套查询是非关联嵌套,理解起来可以类似遍历的理解,对每个外层的tuple,对里层进行结果进行比较:

稍微复杂一点的是关联嵌套,理解起来类似双重循环:

这里用了一些集合的比较操作的关键字,例如EXISTS(Set为非空则为真值,否则为假)。

可以使用嵌套查询重写上文中的INSECTION交集操作,尤其是当查找的结果不是主键的时候使用嵌套操作是有其优越性的。

使用嵌套查询实现除法操作

Solution 1:否定之否定,该水手没有预订的船是不存在的,证明该水手预订了所有的船。

Solution 2:不使用EXCEPT语句也可以实现,基本逻辑是针对一条船,如果不存在一条记录说明该水手预订了这条船,则该水手没有预订这条船,如果这种船不存在的话,那么就可以说明该水手预订了所有的船。

5)聚集函数

COUNT (*):统计一个关系里有多少元组

COUNT ( [DISTINCT] A):统计关系中属性A的值

SUM ( [DISTINCT] A):对A属性的值进行求和

AVG ( [DISTINCT] A):对A属性的值求平均值

MAX (A):对A属性的值求最大值

MIN (A):对A属性的值求最小值

[A is single column]

6)完整的查询语句带有 GROUP BY  和  HAVING

从概念上讲,一条这样的查询语句在DBMS里的执行过程是:首先将FROM子句中涉及到的表进行笛卡尔乘积;其次使用WHERE中的布尔表达式进行筛选;接着按照GROUP BY中的grouping-list根据分组值相等的条件分组;然后使用HAVING子句对组进行筛选,将不符合条件的组筛去;最后按SELECT中的要求进行计算,每一个组得到一条结果元组。因此SELECT子句中的属性和HAVING子句中出现的属性对每个组得是单一的,SQL在文法上要求,这两个子句的属性必须是group-list的子集

举个例子:

另外,需要注意的是聚集函数是不能嵌套使用的。对于下例,我们可以先生成一张对照表简化求解。

7)NULL空值问题

* 对NULL做加减乘除等运算操作,结果均为NULL

* 在默认情况下,对null进行比较(大于,等于,小于)的结果均为false

* 在使用聚集函数时会自动跳过null值(除了 count(*))

* 在布尔表达式中,如果包含null,如果另一个值能唯一确定结果则输出结果,若不能,结果为null

* 对NULL值需要特别处理,可以使用IS NULL , IS NOT NULL进行判断是否为空值

 

四、SQL的新特性

  • CAST表达式

就是进行类型强转,在修改精度,对NULL赋值类型时很有作用。

  • CASE表达式

类似C++中的switch-case,可以进行选择处理。

  • 子查询

子查询可以分为三种:

1)标量子查询:查询结果只有一个值。凡是可以出现value的地方都可以出现标量子查询。

2)表表达式子查询:查询结果为一个表,本质上是一种临时表,根据sql文法,可以出现表的地方都可以使用表表达式。

3)公共表表达式子查询:对同一子查询要使用多次,可以进行合并成公共表。

使用WITH子句可以定义一个公共表表达式,即实现定义一次,多次使用。本质上是一种临时视图。

  • 外连接

  • 递归查询

递归查询是指在公共表表达式CTE中自己调用自己的查询。

CTE的递归查询必须满足三个条件:初始条件,递归调用表达式,终止条件

递归查询至少包含两个子查询:

  1. 第一个子查询称作定点(Anchor)子查询:定点查询只是一个返回有效表的查询,用于设置递归的初始值;
  2. 第二个子查询称作递归子查询:该子查询调用CTE名称,触发递归查询,实际上是递归子查询调用递归子查询
  3. 两个子查询使用union all,求并集;

递归查询没有显式的递归终止条件,只有当递归子查询返回空结果集(没有数据行返回)或是超出了递归次数的最大限制时,才停止递归。

 

posted @ 2018-02-19 18:02  hyserendipity  阅读(1179)  评论(0编辑  收藏  举报