组函数

第五章：组函数

   group by 在查询表中数据的时候进行分组的关键字
       思考:为什么要对数据进行分组
   having   分组之后的进行进一步数据筛选的关键字
       having和where的功能类似

   组函数(分组函数),是指将数据按照某列的值进行分组后，然后使用组函数分别对每个分好的小组中的数据进行处理。所以组函数一般要结合着分组关键字group来使用

   组函数:
       avg       求平均值
       count     计算有多少条数据
       max       最大值
       min       最小值
       sum       求和

       stddev    标准差
       variance 方差


   sql语句的各部分构成
       select   ....
       from   ....
       where   ....
       group by ...
       having   ...
       order by ....

       注:除了select和from之外其他的都不是必须的。

       假如select..from..后面的语句都出现了,那么他们的执行顺序为:
       where-->group by分组-->执行组函数-->having筛选->order by

       组函数出现的位置:
           1.select后面
           2.having后面
           3.order by后面
           4.where后面一定【不能】出现组函数

           注意:如果select/having语句后面出现了组函数,那么select/having后面没有被组函数修饰的列，就必须出现在group by 后面

       where和having对比:
           1.where和having都是做条件筛选的
           2.where执行的时间比having要早
           3.where后面不能出现组函数
           4.having后面可以出现组函数
           5.where语句要紧跟from后面
           6.having语句要紧跟group by后面

       group by和having的关系:
           1.group by可以单独存在,后面可以不出现having语句
           2.having不能单独存在,有需要的话,必须出现在group by后面

       order by语句
           1.如果sql语句中需要排序,那么就一定要写在sql语句的最后面
           2.order by后也可以出现组函数

   使用组函数:不结合group分组使用
       注:如果不使用group分组的话,那么默认当前查询到的所有数据是一组
       例如:
       查询s_emp表中所有员工的平均工资
       select avg(salary)
       from s_emp;

       查询s_emp表中共有多少条数据
       select count(*)
       from s_emp;

       查询s_emp表中所有员工中的最大工资
       select max(salary)
       from s_emp;

       查询s_emp表中所有员工中的最小工资
       select min(salary)
       from s_emp;

       查询s_emp表中所有员工的工资总和
       select sum(salary)
       from s_emp;

       查询s_emp表中所有员工的工资的标准差
       select stddev(salary)
       from s_emp;

       查询s_emp表中所有员工的工资的方差
       select variance(salary)
       from s_emp;

   使用组函数:结合group分组使用
       例如:
       查询s_emp表中每个部门的平均工资
       select dept_id,avg(salary)
       from s_emp
       group by dept_id;

       查询s_emp表中每个部门员工的最高工资
       select dept_id,max(salary)
       from s_emp
       group by dept_id;

       查询s_emp表中每个部门员工的工资总和
       select dept_id,sum(salary)
       from s_emp
       group by dept_id;

       查询s_emp表中每个部门员工的人数
       select dept_id,count(*)
       from s_emp
       group by dept_id;


       //分组之后使用各种组函数
       select dept_id,count(*),min(salary),max(salary),sum(salary),avg(salary)
       from s_emp
       group by dept_id;

   使用组函数:结合group分组以及having筛选使用
       例如:
       查询s_emp表中部门的平均工资大于等于1400的部门
       select dept_id,avg(salary)
       from s_emp
       group by dept_id
       having avg(salary)>=1400;

       思考:上面的sql语句修改为如下,是否可以?

       select dept_id,avg(salary)
       from s_emp
       where avg(salary)>=1400
       group by dept_id;


       查询s_emp表中部门的总工资大于等于4000的部门
       select dept_id,sum(salary)
       from s_emp
       group by dept_id
       having sum(salary)>=4000;

   使用组函数:其他实例
       例如:
       查询s_emp表中部门的平均工资大于等于1400的部门,并且显示出这些部门的名字,同时按照部门编号进行排序
       第一步:查询出基本需求
       select
           dept_id,avg(salary)
       from
           s_emp
       group by
           dept_id
       having
           avg(salary)>=1400
       order by
           dept_id;

       第二步:加入多表查询,并且分别给表起别名
       select
           se.dept_id,avg(se.salary)
       from
           s_emp se,s_dept sd
       group by
           se.dept_id
       having
           avg(se.salary)>=1400
       order by
           se.dept_id;

       第三步:查询出s_dept表中的部门名称,并且进行等值连接
       select
           se.dept_id,avg(se.salary),sd.name
       from
           s_emp se,s_dept sd
       where
           se.dept_id = sd.id
       group by
           se.dept_id
       having
           avg(se.salary)>=1400;
       order by
           se.dept_id;

       第四步:select语句后出现了组函数,那么没有被组函数修饰的列放到group by分组后面
       select
           se.dept_id,avg(se.salary),sd.name
       from
           s_emp se,s_dept sd
       where
           se.dept_id = sd.id
       group by
           se.dept_id,sd.name
       having
           avg(se.salary)>=1400
       order by
           se.dept_id;

       思考:是否可以把where后的条件筛选转移到having语句后面?

       查询s_emp表中最大的工资数,并且显示出这个最大工资的员工的名字


       第一步:查出最大工资数
       select
           max(salary)
       from
           s_emp;

       第二步:加上last_name的显示
       select
           last_name,max(salary)
       from
           s_emp;

       第三步:select后面出现组函数,没有被组函数修饰的列放到group by后面,但是发现查询结果并不是想要结果
       select
           last_name,max(salary)
       from
           s_emp
       group
           by last_name;

       第四步:修改为多表查询(起别名),从s1表中查询出最大的工资数是多少,然后再和s2表连接起来,选出s2表中这个最大工资数的员工名字
       select
           s2.last_name,max(s1.salary)
       from
           s_emp s1,s_emp s2
       where
           s2.salary = max(s1.salary)
       group by
           s2.last_name;

       第五步:where后面不能出现组函数,所以改为having

       select
           s2.last_name,max(s1.salary)
       from
           s_emp s1,s_emp s2
       group by
           s2.last_name,s2.salary
       having
           s2.salary = max(s1.salary);


       练习:
       查询s_emp表每个部门的最大工资数,并且显示出这个最大工资的员工名字以及该部门的名字和该部门所属区域,并且使用部门编号进行排序

       //查询每个部门的最大工资
       select
           max(salary),dept_id

       from
           s_emp

       group by
           dept_id;



       //查询每个部门的最大工资，排序
       select
           max(salary),dept_id

       from
           s_emp

       group by
           dept_id

       order by
           dept_id;



       //显示出这个最大工资的员工名字

       select
           max(s1.salary) ,s1.dept_id,s2.last_name

       from
           s_emp s1,s_emp s2

       where
           s2.dept_id=s1.dept_id

       group by
           s1.dept_id,s2.last_name,s2.salary

       having
           max(s1.salary)=s2.salary

       order by
           s1.dept_id;




       //显示出这个最大工资的员工名字,显示部门名称、部门所在地区
       select
           max(s1.salary) ,s1.dept_id,s2.last_name,d.name,r.name

       from
           s_emp s1,s_emp s2,s_dept d, s_region r

       where
           s2.dept_id=s1.dept_id
           and s1.dept_id=d.id
           and d.region_id=r.id

       group by
           s1.dept_id,s2.last_name,s2.salary,d.name,r.name

       having
           max(s1.salary)=s2.salary

       order by
           s1.dept_id;

第六章：子查询(嵌套查询)
   子查询，即一个select语句中嵌套了另外的一个或者多个select语句

   例如:
   查询工资比Smith工资高的员工信息
       第一步:查询Smith的工资数
       select salary
       from s_emp
       where last_name='Smith';
       结果:
           SALARY
       ----------
               940

       第二步:查询工资比940高的员工信息
       select last_name,salary
       from s_emp
       where salary>940;

       第三步:把第二步中的数字940替换成第一步中的sql语句即可(注意格式)
       select last_name,salary
       from s_emp
       where salary>(
           select salary
           from s_emp
           where last_name='Smith'
       );


   例如:
   查询所有部门的平均工资
   select dept_id,avg(salary)
   from s_emp
   group by dept_id;

   结果:
       DEPT_ID AVG(SALARY)
   ---------- -----------
           42 1081.66667
           43         900
           34        1160
           44        1050
           31        1400
           32        1490
           35        1450
           50        2025
           41      1247.5
           45        1089
           33        1515

       DEPT_ID AVG(SALARY)
   ---------- -----------
           10        1450

   查询平均工资比1247.5高的部门编号
   select dept_id
   from s_emp
   group by dept_id
   having avg(salary)>1247.5;

   结果:
       DEPT_ID
   ----------
           31
           32
           35
           50
           33
           10

   查询平均工资比1247.5高的部门中员工信息
   select last_name,salary,dept_id
   from s_emp
   where dept_id in(10,31,32,33,35,50);

   等价于

   select last_name,salary,dept_id
   from s_emp
   where dept_id in(
       select dept_id
       from s_emp
       group by dept_id
       having avg(salary)>1247.5
   );

   查询平均工资比 41号部门的平均工资高的部门中员工的信息
   select avg(salary)
   from s_emp
   where dept_id=41;

   结果:
   AVG(SALARY)
   -----------
       1247.5

   所以这个sql语句和1247.5是等价的,那么就可以将上面sql语句中的1247.5给替换了
   select last_name,salary,dept_id
   from s_emp
   where dept_id in(
       select dept_id
       from s_emp
       group by dept_id
       having avg(salary)>1247.5
   );
   替换后为:
   select last_name,salary,dept_id
   from s_emp
   where dept_id in(
       select dept_id
       from s_emp
       group by dept_id
       having avg(salary)>(
           select avg(salary)
           from s_emp
           where dept_id=41
       )
   );


   练习:
   注意:(可以把子查询的结果作为一张表来使用)
   查询平均工资比 41号部门的平均工资高的部门中员工的信息,并且显示出当前部门的平均工资




   查询平均工资比 41号部门的平均工资高的部门中员工的信息,并且显示出当前部门的平均工资,同时显示出部门的名字


   查询员工信息,这些员工的工资要比自己所在部门的平均工资高

   查询员工信息,这些员工的工资要比自己所在部门的平均工资高,同时显示部门的名称以及所在地区

   查询工资比 Ngao所在部门平均工资要高的员工信息,同时这个员工所在部门的平均工资也要比Ngao所在部门的平均工资要高

   查询工资比 Ngao所在部门平均工资要高的员工信息,同时这个员工所在部门的平均工资也要比Ngao所在部门的平均工资要高,显示当前部门的平均工资

   查询工资比 Ngao所在部门平均工资要高的员工信息,同时这个员工所在部门的平均工资也要比Ngao所在部门的平均工资要高,显示当前部门的平均工资以及部门的名字和所在地区

posted @ 2019-12-11 15:15 下饭阅读(713) 评论(0) 编辑收藏举报

刷新页面返回顶部

组函数

公告