NameNode故障处理

NameNode故障后，可以采用如下两种方法恢复数据。

1）将SecondaryNameNode中数据拷贝到NameNode存储数据的目录：

（1）kill -9 NameNode进程

（2）删除NameNode存储的数据（/opt/module/hadoop-3.1.3/data/tmp/dfs/name）

rm -rf /opt/module/hadoop-3.1.3/data/dfs/name/*

（3）拷贝SecondaryNameNode中数据到原NameNode存储数据目录：

scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* ./name/

（4）重新启动NameNode

hdfs --daemon start namenode

2）使用-importCheckpoint选项启动NameNode守护进程，从而将SecondaryNameNode中数据拷贝到NameNode目录中。

（1）修改hdfs-site.xml中的信息：

<property>
    <name>dfs.namenode.checkpoint.period</name>
    <value>120</value>
</property>

<property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/module/hadoop-3.1.3/data/dfs/name</value>
</property>

（2）kill -9 NameNode进程

（3）删除NameNode存储的数据（/opt/module/hadoop-3.1.3/data/dfs/name）

rm -rf /opt/module/hadoop-3.1.3/data/dfs/name/*

（4）如果SecondaryNameNode不和NameNode在一个主机节点上，需要将SecondaryNameNode存储数据的目录拷贝到NameNode存储数据的平级目录，并删除in_use.lock文件。

[localhost@hadoop102 dfs]$ scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary ./

[localhost@hadoop102 namesecondary]$ rm -rf in_use.lock

[localhost@hadoop102 dfs]$ pwd
/opt/module/hadoop-3.1.3/data/dfs

[localhost@hadoop102 dfs]$ ls
data  name  namesecondary

（5）导入检查点数据（等待一会ctrl+c结束掉）

bin/hdfs namenode -importCheckpoint

（6）启动NameNode

hdfs --daemon start namenode

posted @ 2022-02-08 20:41 不像话阅读(151) 评论(0) 编辑收藏举报

刷新页面返回顶部

不像话

NameNode故障处理

公告