Hadoop Mapreduce的运行机制

　　在Hadoop中，一个MapReduce作业会把输入的数据集切分为若干独立的数据块，由Map任务以完全并行的方式处理。框架会对Map的输出先进行排序，然后把结果输入给Reduce任务。作业的输入和输出都会被存储在文件系统中，整个框架负责任务的调度和监控，以及重新执行已关闭的任务。MapReduce框架和分布式文件系统是运行在一组相同的节点，计算节点和存储节点都是在一起的。

posted @ 2018-01-27 19:39 李华东阅读(146) 评论(0) 收藏举报

刷新页面返回顶部

Hadoop Mapreduce的运行机制

公告