大数据调优

1.distrbute by rand()或者加表中字段 

           distribute by是控制在map端如何拆分数据给reduce端的。hive会根据distribute by后面列,对应reduce的个数进行分发,默认是采用hash算法

posted on 2019-10-28 10:08  ~handsome  阅读(159)  评论(0编辑  收藏  举报