NodeManager启动流程与服务
本文介绍了NodeManager的启动流程与服务.
NodeManager主流程
在main方法中new一个 NodeManager, 然后初始化并启动.
这里主要看initAndStartNodeManager方法.
首先是增加一个shutDownHook, 即CompositeServiceShutdownHook, 它的目的是为了在NodeManager crash的时候停止compositeService (它维护了nodeManager上所有的service列表).
然后初始化, init(conf):
1. 如果配置了安全选项, 则需初始化containerTokenSecretManager.
2. 初始化ContainerExecutor, 顾名思义, ContainerExecutor封装了nodeManager对Container操作的各种方法, 包括启动container, 查询指定id的container是否活着,等操作. 根据配置yarn.nodemanager.container-executor.class决定ContainerExecutor的实例, 默认为DefaultContainerExecutor.
3. New DeletionService, 用于删除用户文件 …..
4. New AsyncDispatcher, 和RM的AsyncDispatcher一样. 异步分发器.
5. New NodeHealthCheckerService, 一个服务, 可以通过此服务查询node是否健康, 当前node的健康状态包括nodeHealthScriptRunner.isHealthy和dirsHandler.areDisksHealthy
6. 创建NodeStatusUpdater线程, 负责向RM注册和发送心跳(更新状态). 这里使用ResourceTracker协议向RM通信, 底层为YarnRPC. ResourceTracker接口提供了两个方法; 提供注册和心跳功能.
7. NodeResourceMonitor服务, 继承于AbstractService, 没有自己定义方法. 监控node的资源(即资源是否可用, 四种状态, stopped, inited, notinited, started)
8. 创建ContainerManagerImpl服务, 管理container, 启动20个RPC处理线程, 使用ContainerManager协议, ContainerManager协议为APP向NodeManager通信的协议, 提供了三个方法:
注意, 这里获取container的状态包括NEW, RUNNING, COMPLETE. 而container的进度信息其实是有container直接向AM汇报的.
9. 创建webServer, 启动NodeManager的web服务. 通过yarn.nodemanagerwebapp.address设置地址, 默认端口为8042.
10. 初始化Metrics
转载请注明出处(http://www.cnblogs.com/shenh062326/archive/2012/11/24/NodeManager.html)