会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
beipiaodiaosi
新随笔
管理
HIVE之排序
ORDER BY是全局排序,但在数据量大的情况下,花费时间会很长
SORT BY是将reduce的单个输出进行排序,不能保证全局有序
DISTRIBUTE BY可以按指定字段将数据划分到不同的reduce中
当DISTRIBUTE BY的字段和SORT BY的字段相同时,可以用CLUSTER BY来代替 DISTRIBUTE BY with SORT BY
posted @
2019-08-25 21:33
北漂屌丝
阅读(
147
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部