MSSQL - 查询
分页
方法一
SELECT * FROM table_name AS A WHERE 1 = 1
ORDER BY column DESC
OFFSET 0 ROWS FETCH NEXT 20 ROWS ONLY
方法二
SELECT * FROM (
SELECT ROW_NUMBER() OVER(ORDER BY column DESC) AS RowNo, *
FROM table_name AS A WHERE 1 = 1
) AS A WHERE A.RowNo BETWEEN 1 AND 20
分组
SELECT * FROM (
SELECT ROW_NUMBER() OVER(PARTITION BY column ORDER BY column DESC ) AS RowNo
FROM table_name AS A WHERE 1 = 1
) AS A WHERE A.RowNo = 1
执行顺序
(09) SELECT
(10) DISTINCT column,
(06) AGG_FUNC(column or expiression), ...
(01) FROM left_table
(03) JOIN right_table
(02) ON tablename.column = other_tablename.column
(04) WHERE constraint_expiression
(05) GROUP BY column
(07) WITH CUBE|ROLLUP
(08) HAVING constraint_expiression
(11) ORDER BY column ASC|DESC
(12) LIMIT count OFFSET count;
从这个顺序中我们可以发现,所有的查询语句都是从FROM
开始执行的。在实际执行过程中,每个步骤都会为下一个步骤生成一个虚拟表,这个虚拟表将作为下一个执行步骤的输入。 接下来,我们详细的介绍下每个步骤的具体执行过程。
1.FROM
执行笛卡尔积。FROM
才是SQL
语句执行的第一步,并非SELECT
。对FROM
子句中的前两个表执行笛卡尔积 (交叉联接),生成虚拟表 VT1
,获取不同数据源的数据集。FROM
子句执行顺序为从后往前、从右到左,FROM
子句中写在最后的表 (基础表 driving table) 将被最先处理,即最后的表为驱动表,当FROM
子句中包含多个表的情况下,我们需要选择数据最少的表作为基础表。
2.ON
应用ON
过滤器。对虚拟表VT1
应用ON
筛选器,ON
中的逻辑表达式将应用到虚拟表VT1
中的各个行,筛选出满足ON
逻辑表达式的行,生成虚拟表 VT2
。
3.JOIN
添加外部行如果指定了OUTER JOIN
保留表中未找到匹配的行将作为外部行添加到虚拟表VT2
,生成虚拟表VT3
。保留表如下:LEFT OUTER JOIN
把左表记为保留表;RIGHT OUTER JOIN
把右表记为保留表;FULL OUTER JOIN
把左右表都作为保留表
4.在虚拟表VT2
表的基础上添加保留表中被过滤条件过滤掉的数据,非保留表中的数据被赋予NULL
值,最后生成虚拟表VT3
。如果FROM
子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1~3
,直到处理完所有的表为止。
5.WHERE
应用 WHERE 过滤器对虚拟表VT3
应用WHERE
筛选器。根据指定的条件对数据进行筛选,并把满足的数据插入虚拟表VT4
。由于数据还没有分组,因此现在还不能在WHERE
过滤器中使用聚合函数对分组统计的过滤。同时,由于还没有进行列的选取操作,因此在SELECT
中使用列的别名也是不被允许的。
6.GROUP BY
分组。按GROUP BY
子句中的 列 / 列表 将虚拟表VT4
中的行唯一的值组合成为一组,生成虚拟表VT5
。如果应用了 GROUP BY
,那么后面的所有步骤都只能得到的虚拟表 VT5 的列或者是聚合函数(COUNT
、SUM
、AVG
等)。原因在于最终的结果集中只为每个组包含一行。同时,从这一步开始,后面的语句中都可以使用SELECT
中的别名。
7.AGG_FUNC
计算聚合函数计算MAX
等聚合函数。SQL Aggregate
函数计算从列中取得的值,返回一个单一的值。常用的Aggregate
函数包涵以下几种:AVG
:返回平均值;COUNT
:返回行数;FIRST
:返回第一个记录的值;LAST
:返回最后一个记录的值;MAX
:返回最大值;MIN
:返回最小值;SUM
:返回总和。
8.WITH
应用ROLLUP
或CUBE
对虚拟表VT5
应用ROLLUP
或CUBE
选项,生成虚拟表VT6
。CUBE
和ROLLUP
区别如下:CUBE
生成的结果数据集显示了所选列中值的所有组合的聚合。ROLLUP
生成的结果数据集显示了所选列中值的某一层次结构的聚合。
9.HAVING
应用HAVING
过滤器。对虚拟表VT6
应用HAVING
筛选器。根据指定的条件对数据进行筛选,并把满足的数据插入虚拟表VT7
。HAVING
语句在SQL
中的主要作用与WHERE
语句作用是相同的,但是HAVING
是过滤聚合值,在SQL
中增加HAVING
子句原因就是,WHERE
关键字无法与聚合函数一起使用,HAVING
子句主要和GROUP BY
子句配合使用。
10.SELECT
选出指定列。将虚拟表VT7
中的在SELECT
中出现的列筛选出来,并对字段进行处理,计算SELECT
子句中的表达式,产生虚拟表VT8
。
11.DISTINCT
行去重。将重复的行从虚拟表VT8
中移除,产生虚拟表VT9
。DISTINCT
用来删除重复行,只保留唯一的。
12.ORDER BY
排列。将虚拟表VT9
中的行按ORDER BY
子句中的 列 / 列表 排序,生成游标VC10
,注意不是虚拟表。因此使用ORDER BY
子句查询不能应用于表达式。同时,ORDER BY
子句的执行顺序为从左到右排序,是非常消耗资源的。
13.LIMIT/OFFSET
指定返回行。从VC10
的开始处选择指定数量行,生成虚拟表VT11
,并返回调用者。