深入理解 Taier：MR on Yarn 的实现原理

我们今天常说的大数据技术，它的理论基础来自于2003年 Google 发表的三篇论文，《The Google File System》、《MapReduce: Simplified Data Processing on Large Clusters》、《Bigtable: A Distributed Storage System for Structured Data》。这三篇论文分别对应后来出现的 HDFS，MapReduce， HBase。

在大数据的发展历史上，还有一个名字是无论如何都绕不开的，那就是 Doug Cutting。Doug是 Apache Lucene、Nutch、Hadoop、Avro 项目的创始人，2006 年 Docu Cutting 开源了 Hadoop，名字取自于他儿子的玩具小象 Hadoop。

那么就从 Hadoop 起，我们开始本文的分享。

Taier & Yarn

Hadoop

新生事物的成长往往是螺旋上升的，Hadoop 也是如此。Hadoop 1.0 是指 MapReduce + HDFS，其中 MapReduce 是一个离线处理框架，由编程模型（新旧API）、运行时环境（JobTracker 和 TaskTracker）和数据处理引擎（MapTask和ReduceTask）三部分组成。早期的 MapReduce 非常臃肿，有着很明显的缺点，JobTracker 有单点故障问题、框架设计只能执行 MapReduce 任务，不能跑 Storm，Flink 等计算框架的任务。

之后迎来的 Hadoop 2.0 是指 MapReduce + HDFS + Yarn，其中 YARN 是一个资源管理系统，负责集群资源管理和调度， MapReduce 则是运行在 YARN 上的离线处理框架。Hadoop 2.0 很好地解决了单点问题，它将 JobTracker 中的资源管理和作业控制分开，分别由 ResourceManager 负责所有应用程序的资源分配，ApplicationMaster 负责管理一个应用程序。并且解决了扩展问题，包括针对 Hadoop 1.0 中的 MapReduce 在扩展性和多框架支持等方面的不足。

MapReduce 2.0

MapReduce 1.0的工作机制中，角色主要包括客户端，Jobtracker，Tasktracker。Jobtracker 主要是协调作业的运行，而 Tasktracker 是负责运行作业划分之后的任务。网上关于 MR 1.0 的内容很多，这里就不再过多赘述，流程图如下：

到了 MapReduce 2.0，核心思想则是将 MR 1.0 中 JobTracker 的资源管理和任务调度两个功能分开，分别由 ResourceManager 和 ApplicationMaster 进程实现。

MR 2.0 的工作流程主要分为以下6个执行过程（请将图片和文字对照起来看）：

一、作业的提交

1)客户端向 ResourceManager 请求一个新的作业ID，ResourceManager 收到后，回应一个 ApplicationID，见第2步

2)计算作业的输入分片，将运行作业所需要的资源(包括jar文件、配置文件和计算得到的输入分片)复制到一个(HDFS)，见第3步

3)告知 ResourceManager 作业准备执行，并且调用 submitApplication() 提交作业，见第4步

二、作业的初始化

ResourceManager收到对其 submitApplication() 方法的调用后，会把此调用放入一个内部队列中，交由作业调度器进行调度，并对其初始化，然后为该其分配一个 contain 容器，见第5步

5)并与对应的 NodeManager 通信，见第5a步；要求它在 Contain 中启动 ApplicationMaster ，见第5b步

ApplicationMaster 启动后，会对作业进行初始化，并保持作业的追踪，见第6步
ApplicationMaster 从 HDFS 中共享资源，接受客户端计算的输入分片为每个分片，见第7步

三、任务的分配

ApplicationMaster 向 ResourceManager 注册，这样就可以直接通过 RM 查看应用的运行状态，然后为所有的 map 和 reduce 任务获取资源，见第8步

四、任务的执行

ApplicationMaster 申请到资源后，与 NodeManager 进行交互，要求它在 Contain 容器中启动执行任务，见第9a、9b步

五、进度和状态的更新

10)各个任务通过 RPC 协议 umbilical 接口向 ApplicationMaster 汇报自己的状态和进度，方便 ApplicationMaster 随时掌握各个任务的运行状态，用户也可以向 ApplicationMaster 查询运行状态

六、作业的完成

11)应用完成后，ApplicationMaster 向 ResourceManager 注销并关闭自己

手写一个 Yarn 程序

如果想要将一个新的应用程序运行在 YARN 之上，通常需要编写两个组件：客户端和 ApplicationMaster。

· 客户端编写需要注意：客户端通常只需与 ResourceManager 交互，期间涉及到多个数据结构和一个 RPC 协议。

· ApplicationMaster 编写需要注意：ApplicationMaster 需要与 ResoureManager 和 NodeManager 交互，以申请资源和启动 Container，期间涉及到多个数据结构和两个 RPC 协议。

手写一个 YARN Application 程序对理解 YARN 的运行原理非常有帮助，熟悉 Spark 、Flink 计算组件的同学也可以参考 Spark on Yarn、Flink on Yarn 的源代码。

Taier&Yarn

洋洋洒洒，回过头来，现在来给大家介绍一下 Taier 和 Yarn 之间的关系。

Taier 作为一站式大数据任务调度引擎，是数栈数据中台整体架构的重要枢纽，负责调度日常庞大的任务量。它旨在降低ETL开发成本，提高大数据平台稳定性，让大数据开发人员可以在 Taier 直接进行业务逻辑的开发，而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现，将工作的重心更多地聚焦在业务之中。

为了更好地实现让数据开发人员关注业务的目标，Taier 主要在控制台中展示了 Hadoop Yarn的相关信息。分为以下3点：Yarn 配置管理、Yarn 资源管理、任务 on Yarn 的相关配置。