hive partition order by 和 group by 的区别

今天学到一个新技巧,求累加和:sum over (partition order by)

一直没想清楚和group by 的区别,灵光闪现找到了本质区别:

partition by 不改变数据行数,原来多少行还是多少行,group by 改变行数,只保留了group by 之后的结果。

下面这个例子还不错,供参考:

https://www.cnblogs.com/lcngu/p/5335170.html

posted @ 2019-05-21 13:48  语遥  阅读(2585)  评论(0编辑  收藏  举报