利用hadoop1.x集群进行探索性实验(二)【模拟namenode崩溃,通过secondary namenode恢复namenode】
启动集群之后,删除name目录,模拟集群namenode节点崩溃。再次启动发现namenode启动不了。如图。
做法是:关闭集群,然后重新格式化HDFS以再次产生name目录。进入data目录中,打开datanode的version文件,将datanode的namespaceID复制,然后覆盖掉name目录中version文件的namespaceID。这是帮助namenode找回datanode。然后是进入namesecondary目录找到lastcheckpoint文件夹,复制其中的fsimage,覆盖掉name中的current目录中的fsimage,重启集群,即可看见namenode复活!下图是namespaceID覆盖过程。
重启集群,又可以看到熟悉的NN了!
好!又完成一个了!加油!!