mysql必知必会——GROUP BY和HAVING
创建表结构
create table `employ_info` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` char(20) NOT NULL DEFAULT '', `dept` char(20) NOT NULL DEFAULT '', `salary` varchar(255) NOT NULL DEFAULT '', `edlevel` int(11) NOT NULL DEFAULT 0, `hiredate` varchar(255) NOT NULL DEFAULT '', PRIMARY KEY(`id`) ) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8;
添加表内容
INSERT INTO `employ_info` VALUES(1,'张三','开发部','2000','3','2009-10-11'), (2,'李四','开发部','2500','3','2009-10-11'), (3,'王五','设计部','2600','5','2010-10-02'), (4,'王六','设计部','2300','4','2010-10-03'), (5,'马七','设计部','2100','4','2010-10-05'), (6,'赵八','销售部','3000','5','2010-10-07'), (7,'钱九','销售部','3100','7','2010-10-07'), (8,'孙十','销售部','3500','7','2010-10-06');
GROUP BY语法可以根据给定数据列的每个成员对查询结果进行分组统计,最终得到一个分组汇总表。
select子句中的列名必须为分组列或列函数,列函数对于group by子句定义的每个组返回一个结果。
某个员工信息表结构和数据如下:
mysql> select * from employ_info; +----+--------+-----------+--------+---------+------------+ | id | name | dept | salary | edlevel | hiredate | +----+--------+-----------+--------+---------+------------+ | 1 | 张三 | 开发部 | 2000 | 3 | 2009-10-11 | | 2 | 李四 | 开发部 | 2500 | 3 | 2009-10-11 | | 3 | 王五 | 设计部 | 2600 | 5 | 2010-10-02 | | 4 | 王六 | 设计部 | 2300 | 4 | 2010-10-03 | | 5 | 马七 | 设计部 | 2100 | 4 | 2010-10-05 | | 6 | 赵八 | 销售部 | 3000 | 5 | 2010-10-07 | | 7 | 钱九 | 销售部 | 3100 | 7 | 2010-10-07 | | 8 | 孙十 | 销售部 | 3500 | 7 | 2010-10-06 | +----+--------+-----------+--------+---------+------------+ 8 rows in set (0.07 sec)
我想列出每个部门最高薪水的结果,sql语句如下:
mysql> select dept,max(salary) AS MAXIMUM from employ_info group by dept; +-----------+---------+ | dept | MAXIMUM | +-----------+---------+ | 开发部 | 2500 | | 设计部 | 2600 | | 销售部 | 3500 | +-----------+---------+ 3 rows in set (0.37 sec)
解释一下这个结果:
1、 满足“SELECT子句中的列名必须为分组列或列函数”,因为SELECT有group by中包含的列dept;
2、“列函数对于group by子句定义的每个组各返回一个结果”,根据部门分组,对每个部门返回一个结果,就是每个部门的最高薪水。
将where子句与group by子句一起使用
分组查询可以在形成组和计算列函数之前具有消除非限定行的标准where子句。必须在group by子句之前指定where子句
例如,查询公司2010年入职的各个部门每个级别里的最高薪水
mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info group by dept,edlevel; +-----------+---------+---------+ | dept | edlevel | MAXIMUM | +-----------+---------+---------+ | 开发部 | 3 | 2500 | | 设计部 | 4 | 2300 | | 设计部 | 5 | 2600 | | 销售部 | 5 | 3000 | | 销售部 | 7 | 3500 | +-----------+---------+---------+ 5 rows in set (0.00 sec) mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info where hiredate='2010-01-01' group by dept,edlevel; Empty set (0.00 sec) mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info where hiredate='2010-01-07' group by dept,edlevel; Empty set (0.00 sec)
在SELECT语句中指定的每个列名也在GROUP BY子句中提到,未在这两个地方提到的列名将产生错误。GROUP BY子句对dept和edlevel的每个唯一组合各返回一行。
GROUP BY子句之后使用Having子句
可应用限定条件进行分组,以便系统仅对满足条件的组返回结果。因此,在GROUP BY子句后面包含了一个HAVING子句。HAVING类似于WHERE(唯一的差别是WHERE过滤行,HAVING过滤组)AVING支持所有WHERE操作符。
例如,查找雇员数超过2个的部门的最高和最低薪水:
mysql> select dept,MAX(salary) as MAXIMUM,MIN(salary) as MINIMUM from employ_info group by dept having count(*)>2 order by dept; +-----------+---------+---------+ | dept | MAXIMUM | MINIMUM | +-----------+---------+---------+ | 设计部 | 2600 | 2100 | | 销售部 | 3500 | 3000 | +-----------+---------+---------+ 2 rows in set (0.09 sec)
例如,查找雇员平均工资大于3000的部门的最高薪水和最低薪水:
mysql> select dept,max(salary) as MAXIMUM,MIN(salary) as MINIMUM from employ_info group by dept having avg(salary)>3000 order by dept; +-----------+---------+---------+ | dept | MAXIMUM | MINIMUM | +-----------+---------+---------+ | 销售部 | 3500 | 3000 | +-----------+---------+---------+ 1 row in set (0.00 sec)