T-SQL逻辑查询
SQL不同于与其他编程语言的最明显特征是处理代码的顺序。在大多数编程语言中,代码按编码顺序被处理,但在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但几乎总是在最后被处理。
每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最后一步生成的表才会返回 给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。下面是对应用于SQL Server2000和SQL Server2005的各个逻辑步骤的简单描述。
SQL逻辑查询处理的步骤序号
(8) SELECT (9) DISTINCT (11) <TOP_specification> <select_list>
(1) FROM <left_table>
(3) <join_type> JOIN <right_table>
(2) ON <join_condition>
(4) WHERE <where_condition>
(5) GROUP BY <group_by_list>
(6) WITH {CUBE | ROLLUP}
(7) HAVING <having_condition>
(10)ORDER BY <order_by_list>
逻辑查询处理阶段简介
1、FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1。
2、ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
3、 OUTER(JOIN):如果指定了OUTER JOIN(相对于CROSS JOIN或INNER JOIN),保留表(preserved table)中未找到匹配的行将作为外部行添加到VT2,生成VT3。如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行 步骤1到步骤3,直到处理完所有的表为止。
4、WHERE:对VT3应用WHERE筛选器。只有使<where_condition>为TRUE的行才被插入VT4。
5、GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5。
6、CUBE|ROLLUP:把超组(Supergroups)插入VT5,生成VT6。
7、HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为TRUE的组才会被才插入VT7。
8、SELECT:处理SELECT列表,产生VT8。
9、DISTINCT:将重复的行从VT8中移除,产生VT9。
10、ORDER BY:将VT9中的行按ORDER BY子句中的列列表排序,生成一个游标(VC10)。
11、TOP:从VC10的开始处选择指定数量或者比例的行,生成表VT11,并返回给调用者。
SQL逻辑查询理解起来并不是非常困难,但真正理解后对SQL语句的编写能够起到帮助作用,比如如下几点:
1、 处理SELECT语句的顺序比较靠后,所以在SELECT语句中指定的别名能够在ORDER BY中使用,而不能在WHERE,ON,GOUP BY等表达式中使用,
比如:select customerid as cid from customers where cid ='ALFKI' 就会报错:列名'cid' 无效。
2、 WHERE在GROUP BY之前处理,所以在WHERE中不能使用Max,Count等聚合函数,因为这个时候还没有分组,
比如:select customerid,count(customerid) from orders where count(customerid)>6 group by customerid就会报错,这也是HAVING表达式存在的原因,不能将count(customerid)>6写在WHERE条件中而必需使用HAVING
3、对于包含OUT JOIN子句的查询,有一个让人感到困苦的问题,即到底是在ON筛选器还是在WHERE筛选器中指定逻辑表达式。二者的主要区别是ON在添加外部行(步骤3)之前被应用,而WHERE是在步骤3之后被应用。ON筛选器对保留表中部分行的移除并不是最终的,因为步骤3会把这些行再添加回来,而WHERE筛选器对行的移除是最终的,牢记这一点可以帮助你做出正确的选择。
例如,假设你要从CUSTOMERS和ORDERS返回来自MADRID的消费者以及他们的订单,无论该消费者是否有订单都返回,外部联接正是为这种要求设计的。对CUSTOMERS和ORDERS执行左外部联接,把CUSTOMERS作为保留表,是为了能返回没有订单的消费者。你必须在ON子句中指定消费者和订单之间的关系(ON C.customerid=O. customerid)。没有订单的消费者在步骤2中被移除,但又在步骤3被作为外部行添加回来,但是,因为你只想保留来自MADRID的消费者,无论消费者是否有订单,都必须在WHERE子句中指定筛选器(WHERE C.city=’Madria’)。如果ON子句中指定这个声调筛选器,步骤3将把不是来自MADRID的消费者添加回结果集。