【转】group by后使用rollup子句总结

今天接触到了group by后带rollup子句的用法（真是丑死人了，接触ORACLE一两年了今天才知道还有这样一个用法），group by后带rollup子句这个子句所产生的功能实在是太高级了，见了就高兴。但完后感觉也没什么的，很简单的。

下面按我的理解简单总结一下：

一、如何理解group by后带rollup子句所产生的效果

group by后带rollup子句的功能可以理解为：先按一定的规则产生多种分组，然后按各种分组统计数据（至于统计出的数据是求和还是最大值还是平均值等这就取决于SELECT后的聚合函数）。因此要搞懂group by后带rollup子句的用法主要是搞懂它是如何按一定的规则产生多种分组的。另group by后带rollup子句所返回的结果集，可以理解为各个分组所产生的结果集的并集且没有去掉重复数据。下面举例说明：

1、对比没有带rollup的goup by

例：Group by A ,B

产生的分组种数：1种；

即group by A,B

返回结果集：也就是这一种分组的结果集。

2、带rollup但group by与rollup之间没有任何内容

例1：Group by rollup(A ,B)

产生的分组种数：3种；

第一种：group by A,B

第二种：group by A

第三种：group by NULL

（说明：本没有group by NULL 的写法，在这里指是为了方便说明，而采用之。含义是：没有分组，也就是所有数据做一个统计。例如聚合函数是SUM的话，那就是对所有满足条件的数据进行求和。此写法的含义下同)

返回结果集：为以上三种分组统计结果集的并集且未去掉重复数据。

例2：Group by rollup(A ,B,C)

产生的分组种数：4种；

第一种：group by A,B,C

第二种：group by A,B

第三种：group by A

第四种：group by NULL

返回结果集：为以上四种分组统计结果集的并集且未去掉重复数据。

3、带rollup但group by与rollup之间还包含有列信息

例1：Group by A , rollup(A ,B)

产生的分组种数：3种；

第一种：group by A,A,B 等价于group by A,B

第二种：group by A,A 等价于group by A

第三种：group by A,NULL 等价于group by A

返回结果集：为以上三种分组统计结果集的并集且未去掉重复数据。

例2：Group by C , rollup(A ,B)

产生的分组种数：3种；

第一种：group by C,A,B

第二种：group by C,A

第三种：group by C,NULL 等价于group by C

返回结果集：为以上三种分组统计结果集的并集且未去掉重复数据。

4、带rollup且rollup子句括号内又使用括号对列进行组合

例1：Group by rollup((A ,B))

产生的分组种数：2种；

第一种：group by A,B

第二种：group by NULL

返回结果集：为以上两种分组统计结果集的并集且未去掉重复数据。

例2：Group by rollup(A ,(B,C))

产生的分组种数：3种；

第一种：group by A,B,C

第二种：group by A

第三种：group by NULL

返回结果集：为以上三种分组统计结果集的并集且未去掉重复数据。

注：对这种情况，可以理解为几个列被括号括在一起时，就只能被看成一个整体，分组时不需要再细化。因此也可推断rollup括号内也顶多加到一重括号，加多重了应该没有任何意义（这个推断我没有做验证的哦）。

二、与rollup组合使用的其它几个辅助函数

1、grouping()函数

必须接受一列且只能接受一列做为其参数。参数列值为空返回1，参数列值非空返回0。

2、grouping_id()函数

必须接受一列或多列做为其参数。

返回值为按参数排列顺序，依次对各个参数使用grouping()函数，并将结果值依次串成一串二进制数然后再转化为十进制所得到的值。

例如：grouping(A) = 0 ; grouping(B) = 1;

则：grouping_id(A,B) = (01)2 = 1;

grouping_id(B,A) = (10)2 =2;

3、group_id()函数

调用时不需要且不能传入任何参数。

返回值为某个特定的分组出现的重复次数(第一大点中的第3种情况中往往会产生重复的分组)。重复次数从0开始，例如某个分组第一次出现则返回值为0，第二次出现时返回值为1，……，第n次出现返回值为n-1。

注：使用以上三个函数往往是为了过滤掉一部分统计数据，而达到美化统计结果的作用。

三、group by后带rollup子句与group by后带cube子句区别

group by后带rollup子句与group by后带cube子句的唯一区别就是：

带cube子句的group by会产生更多的分组统计数据。cube后的列有多少种组合（注意组合是与顺序无关的）就会有多少种分组。

例：Group by cube(A ,B,C)

产生的分组种数：8种；

第一种：group by A,B,C

第二种：group by A,B

第三种：group by A,C

第四种：group by B,C

第五种：group by C

第六种：group by B

第七种：group by A

第八种：group by NULL

返回结果集：为以上八种分组统计结果集的并集且未去掉重复数据。

四、group by后带grouping sets子句

group by后带grouping sets子句效果就是只返回小记记录，即只返回按单个列分组后的统计数据，不返回多个列组合分组的统计数据。

例1：Group by grouping sets(A )

产生的分组种数：1种；

第一种：group by A

返回结果集：即为以上一种分组的统计结果集。

例2：Group by grouping sets(A ,B)

产生的分组种数：2种；

第一种：group by A

第二种：group by B

返回结果集：为以上两种分组统计结果集的并集且未去掉重复数据。

例3：Group by grouping sets (A ,B,C)

产生的分组种数：3种；

第一种：group by A

第二种：group by B

第三种：group by C

返回结果集：为以上三种分组统计结果集的并集且未去掉重复数据。

select t.city_name,
       decode(t.directline_type,
              null,
              '总数',
              directline_type,
              directline_type),
       sum(t.amount)
from tmp_dl_info t
group by rollup(t.city_name, t.directline_type)

posted on 2012-05-29 22:31 sumsen 阅读(362) 评论(0) 收藏举报

刷新页面返回顶部

SUMSEN