(二)《SQL进阶教程》学习记录--GROUP BY、PARTITION BY
(一) 《SQL进阶教程》学习记录--CASE
(二) 《SQL进阶教程》学习记录--GROUP BY、PARTITION BY
1、语法
GROUP BY <列名1>, <列名2>, <列名3>,根据列分组,通常配合聚合函数用于一些统计的需求。
例1:统计成绩
-- 各科目最高分
select subject,max(fraction) from study group by subject
-- 各科目平均分
select subject,round(avg(fraction),2) from study group by subject
下面简丰富一下表结构改名fraction,插入两期成绩例2:取两期成绩相同
配合HAVING,找两期成绩一样的同学、科目。
select username,subject,fraction from fraction GROUP BY username,subject,fraction HAVING count(1)>1
2、关联子查询
通常例1无法满我们的需求,还要知道最高分是谁,哪一期成绩等,包括前三、前十等需求
例3:取各科目最高、前三
--各科最高
select * from fraction f1 where fraction = (select max(fraction) from fraction f2 where f1.subject = f2.subject)
--各科前三
select * from fraction f where 3 > (select count(*) from fraction where subject = f.subject and fraction>f.fraction ) order by subject,fraction desc;
看到结果条数好像不太对,是因为同分的也查了出来,这是其一,还有另一个问题,写起where条件也麻烦,比如只查第一期成绩。
select * from fraction f where 3 > (select count(*) from fraction where subject = f.subject and fraction>f.fraction and createtime='2021-6-30' ) and createtime='2021-6-30' order by subject,fraction desc;
实际业务、表结构都要比例子要复杂的多,sql语句会变得无比冗长,而且子查询还有性能问题。
3、PARTITION BY
GROUP BY 和 PARTITION BY 都可以根据指定的列为表分组,区别在于 GROUP BY 在分组之后会把每个分组聚合成一行数据。partition by 通常会和 ROW_NUMBER()、RANK() 等窗口函数配合使用。
例4:各种分组、排名、排序
三个窗口函数,选择合适的完成需求,分组、排序、where条件写起来方便简单,逻辑清晰。rank,dense_rank的区别是一个跳号,一个不跳号。
select *,ROW_NUMBER() OVER(PARTITION BY subject ORDER BY subject,fraction desc) rownumber,
RANK() OVER(PARTITION BY subject ORDER BY subject,fraction desc) rank ,
DENSE_RANK() OVER(PARTITION BY subject ORDER BY subject,fraction desc) denserank from fraction where createtime='2021-6-30'
4、本文Get小技巧
(1)、字段拼接
直接使用 || 合并, 例如 SELECT username || subject || '成绩 : ' || fraction as info FROM study
或者函数concat_ws,例如 SELECT concat_ws('',username,subject,'成绩 : ',fraction) as info FROM study where fraction=100
效果相同
(2)、循环
比如测试插入表数据,简单的循环需求,可以用函数generate_series返回一个数组,不用存储过程和游标。
例如:INSERT INTO study_test SELECT '体测', '张三', round(random()::numeric,2) * 100 FROM generate_series(1,10)