【Hadoop故障处理】在高可用(HA)配置下,8088端口无法访问,resourcemanager进程无法启动问题

【故障背景】

8088网页打不开,因8088是yarn平台的端口,所以我从yarn开始排查,首先到各个机器上使用jps命令查看yarn的各个节点是否启动,发现虽然有nodemanager进程,但是主节点机器上的resourcemanager进程未启动,

使用yarn-daemon.sh start resourcemanager单独启动resourcemanager进程。遇到闪退,一开启进程,不一会就自动关闭

【解决步骤】

1. 根据集群规划,到每个zookeeper所在的机器启动zookeeper

zkServer.sh start

然后zkServer.sh status 查看每个机器的zookeeper是否启动成功,即是否存在leader、follow

2. 到主节点机器,也就是namenode所在的机器执行

hdfs zkfc -formatZK

3. 重启Hadoop集群

然后就发现resourcemanager启动成功,8088端口的网页可以访问了。

posted @ 2018-06-10 11:57  Supernova-x  阅读(4916)  评论(0编辑  收藏  举报