ceph集群的数据恢复

场景	触发原因	恢复机制
OSD 宕机	物理磁盘损坏、服务器断电、网络中断等	其他 OSD 上的副本数据自动重建到新 OSD
数据静默损坏	磁盘位翻转、软件 Bug 导致数据不一致	通过副本校验或 Scrubbing 检测并修复损坏数据
扩容/缩容 OSD	集群扩容添加新 OSD，或缩容移除旧 OSD	数据重新平衡（Rebalance）到新 OSD

PG 是数据分布的最小单元：每个 PG 包含多个对象（Object），恢复以 PG 为单位并行执行。
PG 数量越多，并行度越高：
- 若 PG 数量少（如 64），单个 PG 需要迁移大量数据，成为瓶颈。
- 若 PG 数量多（如 512），任务被拆分为更小的单元，多个 PG 可同时恢复。

PG 数量	总数据量	单个 PG 数据量	并行恢复速度（假设单 PG 10 MB/s）
64	500 TB	~7.8 TB	64 PG × 10 MB/s = 640 MB/s → 总耗时 ~9 天
512	500 TB	~0.98 TB	512 PG × 10 MB/s = 5.12 GB/s → 总耗时 ~1.1 天

# 查看集群恢复状态
ceph -s | grep recovery
# 输出示例：recovery io 220 MB/s, recovering 15/512 PGs

# 查看具体 PG 恢复进度
ceph pg dump | grep recovering

参数	作用	调整命令示例
`osd_max_backfills`	单个 OSD 允许的最大并行恢复任务数	`ceph tell osd.* injectargs '--osd_max_backfills 8'`
`osd_recovery_max_active`	全局最大并行恢复任务数	`ceph config set osd osd_recovery_max_active 16`
`osd_recovery_sleep`	恢复任务间的延迟（降低 OSD 负载）	`ceph config set osd osd_recovery_sleep 0.1`

posted on 2025-03-02 19:46 Leo_Yide 阅读(578) 评论(0) 收藏举报