阿里云 ECS 系统崩溃恢复数据过程
故障介绍
系统:ubuntu
研发人员告知 ECS 无法 SSH 连接。登录到阿里云后台,通过 vnc 连接查看,无论输入任何命令都是:
# ls
Segmentation fault
# cd
Segmentation fault
# reboot
Segmentation fault
随即,尝试软重启 ECS ,重启后无法进入系统。这里也有考虑到重启后无法进入系统的情况,但是在无法进行任何命令操作的时候只能重启操作,如下:
尝试过 单用户模式 和 救援模式 都无法进入系统,报错情况一致,于是只能找阿里云技术寻求支持(这里吐槽下,阿里云工单是真的有点慢)。得到以下诊断结果:
然而,最终还是没能救回来。ECS云盘也没有做过快照,更别提数据备份。虽然是测试机,但是研发跑了很多应用和数据。恢复还是很有必要的,阿里云给出了其他方案,还是很不错的。如下:
于是,准备按照阿里云提供的恢复方案执行一下。
初始化操作:
- 您先对此服务器的系统盘和数据盘创建快照进行备份。创建快照,请您参看文档:https://help.aliyun.com/document_detail/25455.html
- 重新初始化系统盘,恢复到最初始的状态,然后正常启动服务器。重新初始化系统盘,请您参看文档:https://help.aliyun.com/document_detail/25449.html
- 如果是linux系统,重新初始化系统盘后,/etc/fstab文件中的挂载信息会被重置,您需要重新创建挂载点并挂载文件系统。
- 您通过系统盘快照创建一个按量付费的云盘,然后把该云盘挂载到服务器中作为数据盘,从数据盘中找回您所需数据。使用快照创建云盘,请您参看文档:https://help.aliyun.com/document_detail/32317.html
- 挂载云盘到服务器上。请您参考文档 https://help.aliyun.com/document_detail/25446.html 进行。 说明:云盘只能挂载到同一地域下同一可用区内的实例上,不能跨可用区挂载。
恢复过程
创建云盘快照
为 云盘 创建 快照
初始化系统盘
在初始化系统盘的时候,首先需要关闭 ECS ,然后在点击 重新初始化云盘
切记:在进行初始化云盘的时候,请确保云盘快照已经完成!
重新初始化后,就可以直接 SSH 连接到 ECS 了。
快照创建云盘
该步骤会产生费用。
通过 快照 创建云盘
创建成功后,直接切换到 ECS 查看磁盘。
直接就进行挂载,然后备份数据。
总结
马老师说过:我不断的提醒自己,要在阳光灿烂的日子修屋顶,不要等到下大雨去修。 共勉。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2020-07-01 Ansible-playbook 篇
2020-07-01 Ansible 服务器初始化 - roles