2018 年 11月 29 日随笔档案 - bf378

2018年11月29日

摘要：如果集群资源充足可以设置：set hive.exec.parallel=true; （默认是false）这样相互独立的job可以并行执行！！！！ count(distinct) 最好改写为group 之后再count distinct 这样并行度高，否则前者会全都放到一个reduce进行去重cou 阅读全文

posted @ 2018-11-29 17:45 bf378 阅读(386) 评论(0) 推荐(0) 编辑

进无止境

生命的闪耀，不坚持到底怎能看到！

公告