数据库原理及应用-用户接口及SQL查询语言(Query Language)
2018-02-07 20:41:39
一、DBMS的用户接口
- 查询语言
- 访问DBMS的访问工具(GUI)
- API
- 相关类库
二、SQL语言
SQL语言可以细分为四种:
1、Data Definition Language (DDL):用来定义,删除或者修改数据模式;
2、Query Language (QL):查询语言
3、Data Manipulation Language (DML):对数据进行插删改操作
4、Data Control Language (DCL):对权限的设置
SQL语言中的一些重要的术语:
1、Base table:基表,就是实实在在存储在磁盘上的关系。
2、View:视图,就是一种虚表,是由基表生成的表。
3、Data type supported:数据类型,各种数据库之间数据类型还是有所差异的。
4、NULL:关键字,空值。由于引入了空值所以布尔表达式变成的三值逻辑,即真假和不知道。
5、UNIQUE:关键字,说明某个属性的值不允许重复。
6、DEFAULT:关键字,为某个属性指定缺省值。
7、PRIMARY KEY:主键
8、FOREIGN KEY:外键
9、CHECK (Integration Constraint):关键字,检查,对某个属性的值进行约束。
一些实例表,下面的举例中会使用到:
三、查询语言(Query Language)
1)基本查询语句
从概念上讲,一条这样的查询语句在DBMS里的执行过程是:首先将FROM子句中涉及到的表进行笛卡尔乘积;其次使用WHERE中的布尔表达式进行筛选;接着将筛选出的表根据SELECT子句中的需要的属性进行投影,将不需要的属性去除掉;最后如果加了DISTINCT,则再进行去重。
举个例子:
别名(Range Variables)的使用问题,在不引起混淆的前提下可以不使用别名。不过建议使用别名,尽量规范的写全。
2)表达式和模糊查询
在SELECT子句中可以使用表达式运算,并将运算结果通过‘=’,AS进行属性名的定义;另外,在WHERE子句中可以使用LIKE子句进行字符串的模糊匹配。
3)集合操作,并交差
4)嵌套查询
一种比较简单的嵌套查询是非关联嵌套,理解起来可以类似遍历的理解,对每个外层的tuple,对里层进行结果进行比较:
稍微复杂一点的是关联嵌套,理解起来类似双重循环:
这里用了一些集合的比较操作的关键字,例如EXISTS(Set为非空则为真值,否则为假)。
可以使用嵌套查询重写上文中的INSECTION交集操作,尤其是当查找的结果不是主键的时候使用嵌套操作是有其优越性的。
使用嵌套查询实现除法操作:
Solution 1:否定之否定,该水手没有预订的船是不存在的,证明该水手预订了所有的船。
Solution 2:不使用EXCEPT语句也可以实现,基本逻辑是针对一条船,如果不存在一条记录说明该水手预订了这条船,则该水手没有预订这条船,如果这种船不存在的话,那么就可以说明该水手预订了所有的船。
5)聚集函数
COUNT (*):统计一个关系里有多少元组
COUNT ( [DISTINCT] A):统计关系中属性A的值
SUM ( [DISTINCT] A):对A属性的值进行求和
AVG ( [DISTINCT] A):对A属性的值求平均值
MAX (A):对A属性的值求最大值
MIN (A):对A属性的值求最小值
[A is single column]
6)完整的查询语句带有 GROUP BY 和 HAVING
从概念上讲,一条这样的查询语句在DBMS里的执行过程是:首先将FROM子句中涉及到的表进行笛卡尔乘积;其次使用WHERE中的布尔表达式进行筛选;接着按照GROUP BY中的grouping-list根据分组值相等的条件分组;然后使用HAVING子句对组进行筛选,将不符合条件的组筛去;最后按SELECT中的要求进行计算,每一个组得到一条结果元组。因此SELECT子句中的属性和HAVING子句中出现的属性对每个组得是单一的,SQL在文法上要求,这两个子句的属性必须是group-list的子集。
举个例子:
另外,需要注意的是聚集函数是不能嵌套使用的。对于下例,我们可以先生成一张对照表简化求解。
7)NULL空值问题
* 对NULL做加减乘除等运算操作,结果均为NULL
* 在默认情况下,对null进行比较(大于,等于,小于)的结果均为false
* 在使用聚集函数时会自动跳过null值(除了 count(*))
* 在布尔表达式中,如果包含null,如果另一个值能唯一确定结果则输出结果,若不能,结果为null
* 对NULL值需要特别处理,可以使用IS NULL , IS NOT NULL进行判断是否为空值
四、SQL的新特性
- CAST表达式
就是进行类型强转,在修改精度,对NULL赋值类型时很有作用。
- CASE表达式
类似C++中的switch-case,可以进行选择处理。
- 子查询
子查询可以分为三种:
1)标量子查询:查询结果只有一个值。凡是可以出现value的地方都可以出现标量子查询。
2)表表达式子查询:查询结果为一个表,本质上是一种临时表,根据sql文法,可以出现表的地方都可以使用表表达式。
3)公共表表达式子查询:对同一子查询要使用多次,可以进行合并成公共表。
使用WITH子句可以定义一个公共表表达式,即实现定义一次,多次使用。本质上是一种临时视图。
- 外连接
- 递归查询
递归查询是指在公共表表达式CTE中自己调用自己的查询。
CTE的递归查询必须满足三个条件:初始条件,递归调用表达式,终止条件。
递归查询至少包含两个子查询:
- 第一个子查询称作定点(Anchor)子查询:定点查询只是一个返回有效表的查询,用于设置递归的初始值;
- 第二个子查询称作递归子查询:该子查询调用CTE名称,触发递归查询,实际上是递归子查询调用递归子查询;
- 两个子查询使用union all,求并集;
递归查询没有显式的递归终止条件,只有当递归子查询返回空结果集(没有数据行返回)或是超出了递归次数的最大限制时,才停止递归。