cdh种hdfs启动ha后,删除namenode恢复

1.从以下界面把删掉的NameNode,JournalNode和Failover Controller的三个角色再给加回去。

 

 2.点击添加角色实例,并相应的选择之前删掉NameNode,JournalNode和Failover Controller角色所在的主机ip-172-31-9-113.ap-southeast-1.compute.internal

 

 3.点击“继续”

 

 

 5.直接重启HDFS服务,尝试拉起刚刚新加的三个角色 

还是失败。

 

6.进入ip-172-31-9-113.ap-southeast-1.compute.internal节点所在的NameNode配置页面。

 选择“配置”标签页 

  在“NameNode Nameservice”配置项中输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。

 

 7.在“Quorum Journal 名称”配置项也输入nameservice1,这里根据你集群启用HA后的实际情况nameservice的名字输入,然后保存。

 

 

 8.勾选“启用自动故障转移”,然后保存。

 

 9.回到HDFS服务的实例页面,发现之前的错误已经消失了。

 

 10.回到CM主页重新部署客户端,并重启集群所有服务。

 

 重启成功,集群恢复正常。

 原文链接:

https://mp.weixin.qq.com/s?__biz=MzI4OTY3MTUyNg==&mid=2247495873&idx=1&sn=2aa2057c70e954baa3cecd4ab2a8c170&chksm=ec2920c8db5ea9deb61c51a76d2d170df51ff7ff78f4ec9223123ee829791ff199a989b7d9ac&scene=21#wechat_redirect

posted @   所向披靡zz  阅读(335)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示