摘要: 一、MapReduce 总体架构 整体的Shuffle过程包含以下几个部分:Map端Shuffle、Sort阶段、Reduce端Shuffle。即是说:Shuffle 过程横跨 map 和 reduce 两端,中间包含 sort 阶段,就是数据从 map task 输出到red... 阅读全文
posted @ 2014-09-23 20:08 DianaCody 阅读(2828) 评论(0) 推荐(0) 编辑
摘要: 典型问题:Hadoop如何判断一个任务失败?失败了怎么做? 分析:实际情况下,用户代码存在软件错误、进程崩溃、机器故障等都会导致失败。Hadoop判断的失败有不同级别类型,针对不同级别的失败有不同的处理对策,这就是MapReduce的容错机制。下面是几个不同级别失败的分类: 一、任务失败 分为3... 阅读全文
posted @ 2014-09-23 12:30 DianaCody 阅读(4493) 评论(0) 推荐(0) 编辑
摘要: 一、MR作业运行过程 JobClient的runJob()方法:新建JobClient实例,并调用其submitJob()方法。提交作业后,runJob()每秒轮询作业进度,如果发现上次上报后信息有改动,则把进度报告输出到控制台。作业完成,成功则显示作业计数器;失败则输出错误到控... 阅读全文
posted @ 2014-09-23 09:49 DianaCody 阅读(1671) 评论(0) 推荐(0) 编辑