HDFS HA误删namenode后报错Nameservice testCluster has no SecondaryNameNode or High-Availability partner的恢复

删除hdfs ha namenode的正常方式是先禁用高可用,今天想试试直接删除其中一个namenode,于是开始操作,结果剩下的NN无法启动。

cm页面报错:“Nameservice testCluster has no SecondaryNameNode or  High-Availability partner”。

解决办法:

  1. hdfs配置里搜索原来的nameservice名(我的是testCluster),删除掉搜索出来的 namenode nameservice 和 quorum journal。
  2. 实例里删除journal node,添加SecondaryNamenode。
  3. 重启nn,报错“java.io.IOException: There appears to be a gap in the edit log.  We expected txid 113850025, but got txid 113855934.”看到这个日志相信你已经明白原因了。
  4. 把删除的nn节点目录下的数据全部(也可以按需挑选)覆盖到当前nn节点目录下。(保守起见可以现把本节点目录备份后再删除)
  5. 重启nn,一切正常了。
posted @   许新浩  阅读(1234)  评论(0编辑  收藏  举报
编辑推荐:
· 智能桌面机器人:用.NET IoT库控制舵机并多方法播放表情
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
阅读排行:
· DeepSeek火爆全网,官网宕机?本地部署一个随便玩「LLM探索」
· 开发者新选择:用DeepSeek实现Cursor级智能编程的免费方案
· 【译】.NET 升级助手现在支持升级到集中式包管理
· 独立开发经验谈:如何通过 Docker 让潜在客户快速体验你的系统
· Tinyfox 发生重大改版
点击右上角即可分享
微信分享提示