摘要: 全排序:order by对全部所有的数据进行排序,在实现的时候是放到一个reduce中进行的,可以想象这样做效率是比较低的;局部排序:sort by对数据进行分组,然后在组内进行排序,每个reduce分别进行自己的排序;row_num()函数:row_num函数通常用over(partition b... 阅读全文
posted @ 2014-11-12 13:08 唠叨阁大学士 阅读(424) 评论(0) 推荐(0) 编辑