MySQL学习记录--分组与聚集
一、group by 子句
group by 字句可对数据进行分组。
以MySQL5.5的sakila数据库中的film数据表举例:查找出各个电影等级的电影总数
mysql>SELECT rating, COUNT(*) AS ratingCount FROM film > GROUP BY rating
结果如下:
可以看出,group by 子句对其后接的字段进行了分组,而这里也用了聚集函数count()对各分组中的项目数进行统计。
二、聚集函数
由上例可以知道,聚集函数是对某个分组的所有行执行特定的操作。下面介绍一些通用的聚集函数:
MAX() : 返回集合中的最大值
MIN() :返回集合中的最小值
AVG() : 返回集合中的平均值
SUM() : 返回集合所有值之和
COUNT() : 返回集合的总条数
还是以film 数据表举例:注:length字段在数据表中代表电影时长
mysql> select max(length),
-> min(length),
-> avg(length),
-> sum(length),
-> count(*)
-> from film;
结果以下
聚集函数可以创建参数表达式,可以根据需要任意增加复杂度,只需要保证最后返回一个数字、字符串或日期即可。
三、聚集函数对null值的处理
sum()、avg()、max()函数都会忽略分组集合中的null值。需要注意,count(字段)是对分组集合中的个数统计,会忽略null,而count(*)表示统计分组集合的行数,不会忽略null。
四、having 子句
先看例子:查找出各个电影等级的电影总数且总数大于200
mysql> SELECT rating, COUNT(*) AS ratingCount FROM film -> GROUP BY rating -> WHERE ratingCount>200;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that -- 报错
corresponds to your MySQL server version for the right syntax to use near 'WHERE
ratingCount>200' at line 3
查询的where 子句中不能包含聚集函数,这是因为where 子句是在分组前执行的,服务器此时还不能对分组执行任何函数。因此,可用having 子句使用聚集函数进行过滤数据
mysql> select rating, count(*) as ratingCount from film -> group by rating -> having ratingCount>200; +--------+-------------+ | rating | ratingCount | +--------+-------------+ | PG-13 | 223 | | NC-17 | 210 | +--------+-------------+ 2 rows in set (0.00 sec)
五、分组查询中的where 和 having
当在包含group by子句的查询中增加过滤条件时,需要考虑过滤是针对原始数据(此时过滤条件应放在where 子句中),还是针对分组后的数据(此时过滤条件应放到having 子句中)。