摘要:
本文转自:http://labs.chinamobile.com/mblogs/573_23352接下来我们按照MapReduce过程中数据流动的顺序,来分解org.apache.hadoop.mapreduce.lib.*的相关内容,并介绍对应的基类的功能。首先是input部分,它实现了MapReduce的数据输入部分。类图如下:类图的右上角是InputFormat,它描述了一个MapReduce Job的输入,通过InputFormat,Hadoop可以:l 检查MapReduce输入数据的正确性;l 将输入数据切分为逻辑块InputSplit,这些块会分配给Mapper;l 提供一个R. 阅读全文