编写第一个 MapReduce 程序
MapReduce 框架实现单词计数(WC)整体流程图
MapReduce 编程步骤
- 编写一个 MapReduce 程序包括编写 Mapper 类、编写 Reducer 类和编写 Job 客户端
- MapReduce 中无论 Mapper 类 还是 Reducer 类, 操作的都是 <Key,Value> 格式的数据
- MapReduce 中的 <Key, Value> 的数据类型必须使用 Hadoop 序列化类型
- Mapper 类 中的 map() 方法:每一个 kv 调用一次(即读取一行数据调用一次)
- Reducer 类中的 reduce() 方法:相同的 key 调用一次(即每个 key 调用一次)
- MapReduce 程序是分布式的并行计算程序(即支持多台机器并行运算)