摘要: InputFormat 负责处理MR的输入部分。有三个作用:一、验证作业的输入是否规范.二、把输入文件切分成InputSplit.三、提供RecordReader 的实现类,把InputSplit读到Mapper中进行处理.◆ 在执行mapreduce之前,原始数据被分割成若干split,每个spl... 阅读全文
posted @ 2014-11-19 14:28 吉日木图 阅读(544) 评论(0) 推荐(0) 编辑