摘要: 一:分区 1:自定义一个Partition类(直接使用上次那个流量统计那个代码) 2:在Driver类中添加Partiton的分区个数 3:运行结果 一:合并(mapTask的合并) 原理图: 1:maptask并行度与决定机制 2 maptask工作机制 3:运用场景 1:多个小文件合并优化(减少 阅读全文
posted @ 2019-05-03 23:42 大魔王阿黎 阅读(221) 评论(0) 推荐(0) 编辑