MapReduce

1、MapReduce的原理
分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce)

 


2、MapReduce的运行流程
基本概念
-Job & Task
-JobTracker
-TaskTracker

 

JobTracker:
(1)作业调度
(2)分配任务、监控任务执行进度
(3)监控TaskTrack的状态
TaskTrack:
(1)执行任务
(2)汇报任务状态

 

 

MapReduce的容错机制
(1)重复执行(默认4次后,放弃执行)
(2)推测执行:某个TaskTrack执行很慢,新建一个TaskTrack执行任务,哪个先执行完则结束另外一个

posted @ 2018-07-12 22:37  八千步  Views(139)  Comments(0Edit  收藏  举报