摘要: MapReduce的整个过程分为map和reduce两个阶段,通俗的说就是map(映射)用来准备需要处理的数据,reduce(归纳)用来实际处理数据。当然,另外还需要一些用来调度作业的代码。mapmapper接口是一个泛型接口,其中有四个参数。前两个参数是输入的一对键与值,后两个参数是输出的一对键与值。其中输入键是一个长整数偏移量(类型为LongWritable),输入值是一行文本;输出键与值类型由开发者自行定义。比如类 public static class Map extends Mapper<LongWritable, Text, Text, Text>其中的map方法定义为 阅读全文
posted @ 2012-07-29 15:53 喵小雨 阅读(783) 评论(0) 推荐(0) 编辑