【ceph运维】DNE状态解析
DNE状态解析
删除osd时,如果没有在crush中删除,osd可能会出现DNE的状态,具体解决方法:
1)过滤处于DNE状态的osd:
ceph osd tree | grep DNE
2)osd DNE状态清楚方法:
ceph osd crush remove osd.id
注意:
删除一块磁盘,由于没有从crushmap中删除,导致一块磁盘的状态变为DNE(does not exist)。DNE对集群有影响。
例如集群删除过一些状态错误的pg,重启整个集群,重新创建pg,这些pg一直处于creating状态,无法消失。查看pg的状态(ceph pg map $PGID),磁盘的分组存在osd无法分配问题,重启osd都不行,删除状态为DNE的osd后,creating状态的pg可以分配osd,集群恢复正常。