GROUP BY,WHERE,HAVING之间的区别和用法
原文发布时间为:2009-03-12 —— 来源于本人的百度文章 [由搬家工具导入]
having子句与where有相似之处但也有区别,都是设定条件的语句。0 I0 G. z9 H: S5 [在查询过程中聚合语句(sum,min,max,avg,count)要比having子句优先执行.而where子句在查询过程中执行优先级别优先于聚合语句(sum,min,max,avg,count)。/ d( R7 a, x. h* ~
简单说来:
2 Y0 S9 C! h$ A- x3 ~; h3 ? where子句:
& v* w0 m; E) f8 P" f8 A9 M select sum(num) as rmb from order where id>10
$ r) R9 L" ^# ]( J2 z //只有先查询出id大于10的记录才能进行聚合语句
1 C5 z; Q9 r9 Y4 I
# Z" i# t/ @2 V: L$ @
6 B' B% Z4 N( ?' w8 W/ k having子句:
, @' c J6 V5 O+ x* ] select reportsto as manager, count(*) as reports from employees
5 ?7 P9 H) `7 V" {+ E- c j group by reportsto having count(*) > 4
. A4 \6 l/ t+ z. _3 \7 R2 j8 w 以northwind库为例.having条件表达示为聚合语句。肯定的说having子句查询过程执行优先级别低于聚合语句。" W) q( k% I" }: \$ |6 X
再换句说话说把上面的having换成where则会出错。统计分组数据时用到聚合语句。
+ q& q# N1 {$ q- f. W. ^8 r e 对分组数据再次判断时要用having。如果不用这些关系就不存在使用having。直接使用where就行了。, g* K* s1 o7 o& w8 [
having就是来弥补where在分组数据判断时的不足。因为where执行优先级别要快于聚合语句。
! v1 ]& v; ^& ~0 d% J n3 {( |0 _# w5 L % Q) v0 t/ g% ^
$ Y" n) O V/ g7 c: \
聚合函数,这是必需先讲的一种特殊的函数:0 P9 u& h7 z2 n) I5 Z) i, V2 I
例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。
5 P! K6 V6 Y' W( _7 X& |2 V5 M! _ SELECT SUM(population) FROM tablename
3 s. f# G3 a. {2 r' _ + e' k/ w9 S# {! a0 W. O" ^
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有
) ^4 f/ O: b1 m' u# Y6 u 国家的总人口数。 通过使用GROUP BY 子句,可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。
+ D- s! o" \2 |* V1 U( X1 ~ 当你指定 GROUP BY region 时, 属于同一个region(地区)的一组数据将只能返回一行值.
! {9 x1 T+ i6 e5 z+ C W 也就是说,表中所有除region(地区)外的字段,只能通过 SUM, COUNT等聚合函数运算后返回一个值.7 B4 n# W9 D; o) V
HAVING子句可以让我们筛选成组后的各组数据.; Y( }; X, \5 m1 O
HAVING子句在聚合后对组记录进行筛选
& C+ O |7 H' g6 n' I$ p 而WHERE子句在聚合前先筛选记录.也就是说作用在GROUP BY 子句和HAVING子句前
) S4 O1 N" \( Y j# n 看下面这几个例子吧:
1 ]: d- u, L' @; h% [; S& {8 @$ _' P$ A2 b/ I: K7 P8 W6 ?& [
一、显示每个地区的总人口数和总面积.* g) w5 u5 F7 @1 `9 U
SELECT region, SUM(population), SUM(area)
; ^, k' J+ v9 G2 f# v/ i4 H' W, A) v FROM bbc# `& e4 k' X* n1 v% ?+ |
GROUP BY region
8 L/ H* _4 f: K% X2 o6 U 先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。# B* i' z `, }* S, E5 i
6 ], L+ y- ?" A% v& m
二、 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区。
+ k9 B, M4 z, @' S SELECT region, SUM(population), SUM(area)7 ]; Z& I! t% i
FROM bbc8 F4 w2 v( P- f
GROUP BY region
# {: ~* r! m) R, ~% j HAVING SUM(area)>1000000# y" P z. O7 D9 `# X
在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
; l m5 y+ x. S" d$ H3 Z4 D- v 相反,HAVING子句可以让我们筛选成组后的各组数据.