'partition by'和'group by''对比
今天大概弄懂了partition by
和group by
的区别联系。
\1. group by
是分组函数,partition by
是分析函数(然后像sum()等是聚合函数);
\2. 在执行顺序上,
以下是常用sql关键字的优先级
from > where > group by > having > order by
而partition by
应用在以上关键字之后,实际上就是在执行完select
之后,在所得结果集之上进行partition
。
3.partition by
相比较于group by
,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel
中的操作),而group by
则只保留参与分组的字段和聚合函数的结果(类似excel
中的pivot
)。
partition by
group by
4.如果在partition
结果上聚合,千万注意聚合函数是逐条累计运行结果的!而在group by
后的结果集上使用聚合函数,会作用在分组下的所有记录上。
数据如下,
SQL1
select a.cc,a.item,sum(a.num)from table_temp a group by a.cc,a.item
Result1
11条记录经group by
后为10条,其中cc='cn' and item='8.1.1'
对应的两条记录的num
汇总成值3.
SQL2
select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num asc) as amount
from table_temp a
group by a.cc,a.num;
select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num desc) as amount
from table_temp a
group by a.cc,a.num;
Result2
两个sql的唯一区别在于a.num
的排序上,但从结果红框中的数据对比可以看到amount
值并不相同,且第二个结果集amount
并不都是最小值1。
在这里就是要注意将聚合函数用在partition
后的结果集上时,聚合函数是逐条累积计算值的!
其实partition by
常同row_number() over
一起使用,
`select`` `a.*, row_number() over (partition ``by` `a.cc,a.item ``order` `by` `a.num ``desc``) ``as` `seq``from` `table_temp a
到此这篇关于详解partition by
和group by
对比的文章就介绍到这了