案例研究–亚马逊服务中断,数据库崩溃–我们恢复数据库且无数据损失

云络科技提供全方位服务器管理服务,几乎可处理任何服务器问题,包括服务器瘫痪,数据损坏,IDC问题等等。


我们向客户按月收取固定费用,但提供不限次数的技术支持,所以我们会尽力避免发生任何问题,即便如此,偶尔还是会有问题,但我们仍然能够努力地解决这些问题。


2012年初,由于暴风雨影响,导致EC2 数据中心断电,使我们Amazon上的一名客户数据库数据严重损坏,其主要数据处理工具及实时数据系统均无法运行,后来,是我们帮助该客户进行修复工作。


我们的EC2及MySQL专家能够重新建立损坏的EBS卷, 利用S3 数据进行日常备份恢复,重新加载未损坏的binlog将数据库恢复至断点前的状态。这样,遭遇突发事件时,系统不会丢失数据并能继续重新运行。此外,云络科技最佳的实践经验就是,将文件系统架构分离出来,避免给其它系统带来问题,也使得系统恢复更快、更可靠。


尽管此类紧急恢复,对于我们来说是小菜一碟,但是对于这个客户来说,却是救星,因为客户完全依赖我们,期望我们成为他们的专用IT人员。若不是我们提供服务,他们很难应对EC2/EBS恢复、处理损坏的数据和工具、S3恢复,以及最终重载binlog进行系统恢复,使系统继续运行。


我们尽力避免此类故障,并一直推荐客户采用高可靠性双服务器架构,但是,一旦发生此类严重故障,我们将确保提供全天候服务,帮助客户保护其数据及系统。

 

                                 (Authored by Steve Mushero / ChinaNetCloud CEO & CTO  本博客英文原文请点此查看

 

posted @ 2013-03-27 22:48  javawebsoa  Views(292)  Comments(0Edit  收藏  举报