集群中各个进程
ha:
NameNode:是整个文件系统的管理节点。它维护着
1.整个文件系统的文件目录树
2.文件/目录的元信息和每个文件对应的数据块列表。
3.接收用户的操作请求。
DataNode:提供真实文件数据的存储服务。
JournalNode:NameNode之间共享数据
DFSZKFailoverController:它负责整体的故障转移控制等。它是一个守护进程
yarn
ResourceManager:负责集群中所有资源的统一管理和分配,它接收来自各个节点(NodeManager)的资源汇报信息,并把这些信息按照一定的策略分配给各个应用程序
NodeManager:每台机器上的代理,负责容器管理,并监控它们的资源使用情况
zookeeper
QuorumPeerMain:这是QuorumPeerMain是zookeeper集群的启动入口类,是用来加载配置启动QuorumPeer线程的。
HBase
HRegionServer:
1)监控 RegionServer
2)处理 RegionServer 故障转移
3)处理元数据的变更
4)处理 region 的分配或移除
5)在空闲时间进行数据的负载均衡
6) 通过 Zookeeper 发布自己的位置给客户端
HMaster:
1) 负责存储 HBase 的实际数据
2) 处理分配给它的 Region
3) 刷新缓存到 HDFS
4) 维护 HLog
5) 执行压缩