摘要: 本篇文章主要从mapreduce运行作业的过程,shuffle,以及mapreduce作业失败的容错几个方面进行详解。 一、mapreduce作业运行过程 1.1、mapreduce介绍 MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduc 阅读全文
posted @ 2019-09-27 20:16 一寸HUI 阅读(27343) 评论(0) 推荐(6) 编辑