hive的sort和order

order by,全排序

出于安全原因,不加limit是禁用的。(非严格模式下nostrict)

两个order by就是MR中的二次排序;

sort by,只能保证每个reduce是排序的,部分排序,使用是需要指定reduce个数

排序列必须出现在结果集中

distribute by,类似于分组,也就是MR中的分区过程,必须在sort by语句之前出现

cluster by,r如果sort by和distribute by使用的同一字段,就可以使用cluster by

 

posted @ 2020-05-19 16:26  疯狂摇头的青蛙  阅读(730)  评论(0编辑  收藏  举报