编写第一个 MapReduce 程序

MapReduce 框架实现单词计数(WC)整体流程图

MapReduce 编程步骤
  • 编写一个 MapReduce 程序包括编写 Mapper 类、编写 Reducer 类和编写 Job 客户端
  • MapReduce 中无论 Mapper 类 还是 Reducer 类, 操作的都是 <Key,Value> 格式的数据
  • MapReduce 中的 <Key, Value> 的数据类型必须使用 Hadoop 序列化类型
  • Mapper 类 中的 map() 方法:每一个 kv 调用一次(即读取一行数据调用一次)
  • Reducer 类中的 reduce() 方法:相同的 key 调用一次(即每个 key 调用一次)
  • MapReduce 程序是分布式的并行计算程序(即支持多台机器并行运算)
posted @ 2021-12-02 20:41  追こするれい的人  阅读(33)  评论(0编辑  收藏  举报