mapreduce负责计算:
map阶段并行处理输入数据。
reduce阶段负责对map的结果进行汇总。
yarn是hadoop的资源管理器。管理cpu和内存。
相关组件:
resourcemanager:管理整个集群的资源
nodemanager:管理单节点服务器资源
applicationmaster:管理单个任务(负责任务调度)
container:容器,封装了任务运行所需要的资源(负责资源调度)