SQL中的grpup by
原文地址:https://blog.csdn.net/hengji666/article/details/54924387
练习地址:http://sqlfiddle.com/#!9/ad7c8b/12
Create table If Not Exists Courses (student varchar(255), class varchar(255)); Truncate table Courses; insert into Courses (student, class) values ('A', 'Math'); insert into Courses (student, class) values ('B', 'English'); insert into Courses (student, class) values ('C', 'Math'); insert into Courses (student, class) values ('D', 'Biology'); insert into Courses (student, class) values ('E', 'Math'); insert into Courses (student, class) values ('F', 'Computer'); insert into Courses (student, class) values ('G', 'Math'); insert into Courses (student, class) values ('H', 'Math'); insert into Courses (student, class) values ('I', 'Math');
select class, count(student) as student from courses group by class having count(student) >= 5 ;
我和原博文作者一样,突然间不会用group by了(可能是一直都不会用),就找了一下详解,这篇文章讲的很形象,学习一波
看一下测试表test
对这个表写group by
时,可能就会发生下面这样的怪事:
select name from test group by name -- ok
select * from test group by name --error
select name,sum(number) from test group by name -- ok
- 1
- 2
- 3
行吧,接下来一步步的来看。
1. 单列group by
对 test表(表1)执行下面语句
select name from test group by name
- 1
结果很明显,这是表2
为了能够更好的理解“group by”多个列“和”聚合函数“的应用,由表1到表2的过程中,增加一个虚构的中间表:虚拟表3。下面说说如何来思考上面SQL语句执行情况:
-
from test:sql执行的第一步,找表,这个没啥变化;
-
from test group by name:没有join 和 where 操作,就是group by了,这时候的过程就如下图所示了,找到name那一列,将具有相同name值的行,合并成同一行。比如nama = aa时,就将<1,aa,2>和<2,aa,3>这两行合并,其它字段(id,number)合并在一个单元格;
-
接下来就对产生的虚拟表3进行select操作了,这时候就可以看出上面的几句select的问题出在哪了。
(1)直接 select name 是没问题的,因为group by 的字段就是name,每个单元格只有一个name,某闷忒;
(2)执行 select * 的话,就是从表3中选择,可是id 和 number 字段中的单元格里的内容有多个值,关系型数据库是不允许这样的,这样就无法形成严格的关系约束条件了,所以会报错;
那么,对于 id 和 number列咋办呢?聚合函数。
不知道大家有没有遇到过 aggregator blah blah 之类的报错,我用 group by 的时候就放过这个错,现在想来应该就是 后面用了 group by,却没对字段进行聚合,导致单元格里有多个值。
聚合函数,就是用来输入多个数据,输出一个数据的,如count(id), sum(number),每个聚合函数的输入就是每一个多数据的单元格。
因此,这里可以执行
select name,sum(number) from test group by name
- 1
那么sum 函数就是对虚拟表3中,每个name对应的number单元格进行sum操作,就可以得到:
2. 对多列进行 group by
那要是group by 多个字段怎么理解呢, 比如还是在test 表中,group by name,number
,此时我们可以将name 和 number 看成一个整体字段,将其作为一个整体来进行判断划分的。如图:
这里只有 <bb, 5>和<cc, 6>是 name 和 number 都相等的,所以将其进行合并,其余并不完全一样,所以没有进行分组合并。
此时执行以下语句
select name,sum(id) from test group by name,number
- 1
就可以得到
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?