会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Jack_chengdu
2018年12月25日
order by/sort by/distribute by /cluster by 的区分
摘要: 主要说说这3者的区分和场景: 1.order by:这是日常使用最多的,因为是最终的排序,所以是全局的,所以最后只会有1个reduce(set mapred.reduce.tasks=n无效)完成。假如sql的执行结果的数据量很大的话,这里就会比较坑。 2.sort by:sortby不是全局排序,
阅读全文
posted @ 2018-12-25 11:28 Jack_chengdu
阅读(752)
评论(0)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理
公告