SQL中的distinct与group
distinct 和 group by 使用对比 转[http://blog.tianya.cn/blogger/post_show.asp?BlogID=1670295&PostID=16574281]
t3表的结构如下:
Select * FROM t3
id edu age
1 本 20
2 本 25
3 本 30
4 本 30
5 本 25
6 中 15
7 中 20
8 中 20
9 专 20
10 专 20
11 专 20
12 专 30
13 专 30
--------------------------------------
Select distinct edu,age
FROM t3
order by age
edu age
中 15
本 20
中 20
专 20
本 25
本 30
专 30
小结:1、distinct edu,age 是将edu,age两个字段看成一体,只要edu,age这两个字段相同,
就将其视为重复记录;
2、在Select中只能用一次distinct或all;
3、在Select中用了distinct就不能用ALL;用了ALL就不能用distinct;不能同时存在;
4、如果指定了SELECT DISTINCT,那么ORDER BY 子句中的项就必须出现在选择列表中;
---------------------------------------
select edu,age,count(*) as '人数'
--into
from t3
--where id<10
--where 分组前记录的过滤条件
group by edu,age
--having 分组后对组的过滤条件
order by age
edu age 人数
中 15 1
本 20 1
中 20 2
专 20 3
本 25 2
本 30 2
专 30 2
小结:1、distinct edu,age 是将edu,age两个字段看成一体,只要edu,age这两个字段相同,
就将其视为同组;
2、SELECT子句中的列名必须为分组列或列函数;
3、where子句中的列名可以为表中任意字段;
4、having子句中的列名必须为分组列或列函数;
group by使用
通用数据库具有基于表的特定列对数据进行分析的能力。
可按照在 GROUP BY 子句中定义的组对行进行分组。以其最简单的形式,组由称为分组列的列组成。 SELECT 子句中的列名必须为分组列或列函数。列函数对于 GROUP BY 子句定义的每个组各返回一个结果。
(一)将 WHERE 子句与 GROUP BY 子句一起使用 :
分组查询可以在形成组和计算列函数之前具有消除非限定行的标准 WHERE 子句。必须在GROUP BY 子句之前指定 WHERE 子句。
例如:
SELECT WORKDEPT, EDLEVEL, MAX(SALARY) AS MAXIMUM
FROM EMPLOYEE
WHERE HIREDATE > '1979-01-01'
GROUP BY WORKDEPT, EDLEVEL
ORDER BY WORKDEPT, EDLEVEL
结果为:
WORKDEPT EDLEVEL MAXIMUM
-------- ------- -----------
D11 17 18270.00
D21 15 27380.00
D21 16 36170.00
D21 17 28760.00
E11 12 15340.00
E21 14 26150.00
注意:在SELECT 语句中指定的每个列名也在 GROUP BY 子句中提到。未在这两个地方提到的列名将产生错误。GROUP BY 子句对 WORKDEPT 和 EDLEVEL 的每个唯一组合各返回一行。
(二)在 GROUP BY 子句之后使用 HAVING 子句 :
可应用限定条件进行分组,以便系统仅对满足条件的组返回结果。为此,在GROUP BY 子句后面包含一个 HAVING 子句。 HAVING 子句可包含一个或多个用 AND 和 OR 连接的谓词。每个谓词将组特性(如 AVG(SALARY))与下列之一进行比较:
(1)该组的另一个特性
例如:
HAVING AVG(SALARY) > 2 * MIN(SALARY)
(2)常数
例如:
HAVING AVG(SALARY) > 20000
例如,下列查询寻找雇员数超过 4 的部门的最高和最低薪水:
SELECT WORKDEPT, MAX(SALARY) AS MAXIMUM, MIN(SALARY) AS MINIMUM
FROM EMPLOYEE
GROUP BY WORKDEPT
HAVING COUNT(*) > 4
ORDER BY WORKDEPT
此语句产生下列结果:
WORKDEPT MAXIMUM MINIMUM
-------- ----------- -----------
D11 32250.00 18270.00
D21 36170.00 17250.00
E11 29750.00 15340.00
有可能(虽然很少见)查询有 HAVING 子句但没有 GROUP BY 子句。在此情况下,DB2 将整个表看作一个组。因为该表被看作是单个组,所以最多可以有一个结果行。如果 HAVING 条件对整个表为真,则返回选择的结果(该结果必须整个由列函数组成);否则不返回任何行。