摘要:
自定义OutputFormat类 思考一个问题:我们前面编程的时候可以发现,一个reducetask默认会把结果输出到一个文件。那如果我们想要让一个reducetask的结果分类输出到不同文件中,要怎么实现,我们可以通过自定义outputformat类来解决。 案例需求 现在有一些订单的评论数据,需 阅读全文
摘要:
Mapreduce--分区(shuffle) 分区partition 我们来回顾一下mapreduce编程指导思想中的第三个步骤(shuffle阶段的分区): 第三步:对输出的key,value对进行分区:相同key的数据发送到同一个reduce task里面去,相同key合并,value形成一个集 阅读全文