hive中,动态添加map和reduce的大小,以增加并行度

map是配置mapred.max.split.size,来定义map处理文件的大小,默认是256000000字段,换算就是256M。  如果想增加map的并行度,那么就是减少map处理文件的大小即可。 即set mapred.max.split.size=xxx(更小的字节)

 

reduce和map是一致的,修改hive.exec.reducers.bytes.per.reducer这个参数

 

 

hive.exec.reducers.bytes.per.reducer

通过控制这个来定义一个reduce处理文件的大小。

posted @ 2017-07-03 19:21  HarkLee  阅读(1903)  评论(0编辑  收藏  举报