MapReduce学习一
1、相关介绍--分而治之
MapReduce分布在Yarn集群
2、设计构思(以wordcount为例)
第一步-->读取文件,读取为键值对类型,偏移量,该行的内容;
第二步(Map阶段)-->转换成为另一种键值对模式,单词,1;
第三步(Suffle阶段)-->转换成另一种键值对模式,单词,<有几个这个单词,便有几个1用逗号隔开>;
第四步(Reduce阶段)-->转换成单词,单词数量的键值对模式;
第五步-->保存结果;
MapReduce分布在Yarn集群
第一步-->读取文件,读取为键值对类型,偏移量,该行的内容;
第二步(Map阶段)-->转换成为另一种键值对模式,单词,1;
第三步(Suffle阶段)-->转换成另一种键值对模式,单词,<有几个这个单词,便有几个1用逗号隔开>;
第四步(Reduce阶段)-->转换成单词,单词数量的键值对模式;
第五步-->保存结果;