MapReduce概述
1、MapReduce是一种分布式计算模型
2、MapReduce合并了两种经典函数:
映射(Mapping):对集合里每一个目标都应用一个操作。
例如:如果你想把表单里每个单元格乘以二,那么把这个函数单独地应用在每个单元格上的操作就属于mapping。
化简(Reducing):遍历集合中的元素来返回一个综合的结果。
例:
输出表单里一列数字的和这个任务属于reducing。
3、MapReduce由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce()两个函数,即可实现分布式计算,非常简单。