会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
进无止境
生命的闪耀,不坚持到底怎能看到!
博客园
首页
新随笔
联系
订阅
管理
2018年11月29日
hive并行执行作业; 强化在脑海的印象
摘要: 如果集群资源充足可以设置:set hive.exec.parallel=true; (默认是false) 这样相互独立的job可以并行执行!!!! count(distinct) 最好改写为group 之后再count distinct 这样并行度高,否则前者会全都放到一个reduce进行去重cou
阅读全文
posted @ 2018-11-29 17:45 bf378
阅读(386)
评论(0)
推荐(0)
编辑
公告