摘要: 一、MapReduce执行过程 MapReduce运行时,首先通过Map读取HDFS中的数据,然后经过拆分,将每个文件中的每行数据分拆成键值对,最后输出作为Reduce的输入,大体执行流程如下图所示: 整个流程图具体来说:每个Mapper任务是一个java进程,它会读取HDFS中的文件,解析成很多的 阅读全文
posted @ 2019-04-23 12:44 代码让自己变强 阅读(6258) 评论(0) 推荐(3) 编辑