删除osd后引起的CEPHADM_FAILED_DAEMON错误
CEPHADM_FAILED_DAEMON: 1 failed cephadm daemon(s)
图形界面下 mark out 并delete一块硬盘后,系统健康状态显示daemon守护进程ERROR状态
Mark OSD flags (out, in, down, lost, …)
Note: osd must be marked down before marking lost.
没有勾选保留OSD ID,新加入的硬盘会使用到旧硬盘的OSD ID
如果是用命令行,操作如下:
将节点状态标记为out (节点已经不再提供服务)
ceph osd out osd.3
从crush中移除节点(不删除会影响到当前主机的host crush weight)
ceph osd crush remove osd.3
删除节点
ceph osd rm osd.3
删除节点认证(不删除编号会占住)
ceph auth ls
ceph auth del osd.3
列出所有daemons,确认哪个有异常
ceph orch ps
ceph orch daemon stop osd.3
重启节点后后还是会自动启动daemon进程
强制删除
ceph orch daemon rm osd.3 --force
重启后,系统Health OK
可能出现的异常:
前面因没有保留OSD ID,新加入的硬盘会使用此ID,如果此时删除错误的daemon,会连同将使用相同OSD ID的正常daemon一起删除,引起所在节点启动daemon时出错
ssh-copy-id -f -i ceph.pub root@ceph-mon2
重新复制ceph.pub并重启ceph-mon2,至此health OK
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现