报错背景
Linux服务器集群发现数据倾斜问题严重,于是想要开启负载均衡服务,但是发现Balancer启动之后自己挂掉。
报错现象
查看日志:/data/hadoop/logs,发现报错信息。
报错原因
hadoop集群中的两个NameNode均为standby状态。
可以查看你的NameNode状态,是否属于这种现象。
# hdfs haadmin -getServiceState nn1
# hdfs haadmin -getServiceState nn2
如果两个NameNode均为standby状态,那么很有可能是DFSZKFailoverController出现了问题。
报错解决
(1)手动改变其中一个NameNode的状态
# hdfs haadmin -transitionToActive -forcemanual nn1
(2)如果手动改变状态不能解决问题,那就重启dfs
# stop-dfs.sh
# start-dfs.sh
再检查NameNode状态