摘要: 如图所示:有三个ReducerTask,因此处理完成之后的数据存储在三个文件中; 默认情况下,numReduceTasks的数量为1,前面做的实验中,输出数据都是在一个文件中。通过自定义myPatitioner类,可以把ruduce处理后的数据分类汇总,这里MyPartitioner是Partiti 阅读全文
posted @ 2016-04-06 11:52 nwpulisz 阅读(2228) 评论(0) 推荐(0) 编辑