删除osd后引起的CEPHADM_FAILED_DAEMON错误

   

   

CEPHADM_FAILED_DAEMON: 1 failed cephadm daemon(s)

   

   

图形界面下 mark out 并delete一块硬盘后,系统健康状态显示daemon守护进程ERROR状态

   

Mark OSD flags (out, in, down, lost, …)

Note: osd must be marked down before marking lost.

   

   

   

没有勾选保留OSD ID,新加入的硬盘会使用到旧硬盘的OSD ID

   

   

   

如果是用命令行,操作如下:

   

将节点状态标记为out (节点已经不再提供服务)

ceph osd out osd.3

   

从crush中移除节点(不删除会影响到当前主机的host crush weight)

ceph osd crush remove osd.3

   

删除节点

ceph osd rm osd.3

   

   

删除节点认证(不删除编号会占住)

ceph auth ls

ceph auth del osd.3

   

   

   

列出所有daemons,确认哪个有异常

ceph orch ps

   

   

ceph orch daemon stop osd.3

重启节点后后还是会自动启动daemon进程

   

强制删除

ceph orch daemon rm osd.3 --force

    

重启后,系统Health OK

   

 

 

可能出现的异常:

前面因没有保留OSD ID,新加入的硬盘会使用此ID,如果此时删除错误的daemon,会连同将使用相同OSD ID的正常daemon一起删除,引起所在节点启动daemon时出错

   

   

   

   

   

ssh-copy-id -f -i ceph.pub root@ceph-mon2

重新复制ceph.pub并重启ceph-mon2,至此health OK

   

   

   

   

   

posted @   ST运维  阅读(3317)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示