cdh种hdfs启动ha后,删除namenode恢复

1.从以下界面把删掉的NameNode,JournalNode和Failover Controller的三个角色再给加回去。

 

 2.点击添加角色实例,并相应的选择之前删掉NameNode,JournalNode和Failover Controller角色所在的主机ip-172-31-9-113.ap-southeast-1.compute.internal

 

 3.点击“继续”

 

 

 5.直接重启HDFS服务,尝试拉起刚刚新加的三个角色 

还是失败。

 

6.进入ip-172-31-9-113.ap-southeast-1.compute.internal节点所在的NameNode配置页面。

 选择“配置”标签页 

  在“NameNode Nameservice”配置项中输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。

 

 7.在“Quorum Journal 名称”配置项也输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。

 

 

 8.勾选“启用自动故障转移”,然后保存。

 

 9.回到HDFS服务的实例页面,发现之前的错误已经消失了。

 

 10.回到CM主页重新部署客户端,并重启集群所有服务。

 

 重启成功,集群恢复正常。

 原文链接:

https://mp.weixin.qq.com/s?__biz=MzI4OTY3MTUyNg==&mid=2247495873&idx=1&sn=2aa2057c70e954baa3cecd4ab2a8c170&chksm=ec2920c8db5ea9deb61c51a76d2d170df51ff7ff78f4ec9223123ee829791ff199a989b7d9ac&scene=21#wechat_redirect

posted @ 2022-08-02 10:51  所向披靡zz  阅读(296)  评论(0编辑  收藏  举报