hadoop 2.0 中的两种RPC详解

Hadoop 2.0中存在两个ipc包, 分别为hadoop RPC和新的YarnRPC, 本文简要描述了两种RPC.

Hadoop 2.0中存在两个ipc包, 分别在hadoop-common和hadoop-yarncommon项目下. 分别为hadoop RPC和新的YarnRPC.

1. 使用hadoop ipc包的协议

原有的协议

协议名

客户端

服务端

主要方法

ClientProtocol

Client

Namenode

 

DatanodeProtocol

DN

NN

 

NamenodeProtocol

SNN

NN

 

RefreshAuthorizationPolicyProtocol

Client

NN

 

RefreshUserMappingsProtocol

Client

NN

 

GetUserMappingsProtocol

Client

NN

 

TaskUmbilicalProtocol

YarnChild(运行task的containner)

AM

状态更新, 获取map结束事件等

2. 使用YarnRPC的协议

这些都是用在yarn上的协议, 并且都是0.23开始新增的协议.

协议名

客户端

服务端

主要方法

ClientRMProtocol

Client

RM

提交,查询,kill AM等

AMRMProtocol

AM

RM

注册, 结束AM, 请求资源

ContainerManager

AM

NM

启动, 停止, 查询 container

RMAdminProtocol

Client

RM

刷新node, queu, acl等

HSClientProtocol

Client

HistoryServer

继承于MRClientProtocol

MRClientProtocol

Client

AM

获取job/task信息, kill job/task等

下图显示了yarn中各个进程使用的协议.

PZM~{(O6073A2AF(QM2P@@3

3. 为什么要新增YarnRPC呢

事实上, YarnRPC只是封装了hadoop-common的ipc, 最终还是使用了hadoop-common的ipc包, 包括server和client, 所以底层的网络通信方法是一样的.

新增的协议都使用了YarnRPC包,

至于底层使用何种序列化方式, 可以通过配置决定:

yarnRPC的底层序列化方式: yarn. ipc. serializer.type 默认为protocolbuffers

hadoop-common RPC的序列化方式: rpc.engine.( protocol.getName()) 默认为WritableRpcEngine

posted @ 2012-12-16 13:04  南国故人(Wall)  阅读(3756)  评论(1编辑  收藏  举报