cdh因为无法恢复yarn任务导致yarn ResourceManager无法重启
1 因为内存溢出问题导致yarn ResourceManager无法启动,多次重启仍然失败
2 查询到原因是因为重启rm的时候,会尝试恢复之前所有的yarn任务,但是之前内存溢出的原因就是因为yarn任务的内存压力过大导致。所以不断重启也没用。
3 解决方案,进入zookeeper控制台,找到保存yarn任务的地方,删除yarn任务信息,待resourceManager启动成功后,重新提交之前的任务。
sh /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/zookeeper/bin/zkCli.sh
ls /rmstore/ZKRMStateRoot/RMAppRoot
rmr /rmstore/ZKRMStateRoot/RMAppRoot/对应的任务id
4 之后重启成功,重新提交任务也可以运行了。