如何看待 SAE 在2014 年 3 月 24 日发生的的大面积宕机事故?

3 月 24 日晚间大约 23 点左右,新浪云 SAE 一处核心机柜掉电,导致 SAE 平台下大量应用无法正常访问,并在 10 小时后才陆续修复。这次事故暴露 SAE 的哪些缺陷?SAE 运维人员又是做何感想?

SAE官微虽然在第一时间发布了宕机公告,在稍后宣布抢修并赔偿所有用户,不过之后就没动静了,连续一晚上的主站无法访问,国内节点和日本节点无法访问,这不是一个成熟的云服务商所发生的。。。最起码让二级域名或者主站跳转到备用服务器给个公告 阿喂

我的私人博客、两个微信公众和一个易信公众都罢工了。。。

然后就意识到了网站监控的重要性,把几个sae应用都挂上了。

说好的赔偿呢?

首先,个人感觉SAE的运维还是非常负责的,他在某SAE开发者群中非常耐心的“安抚”(好吧我词穷了)我们。 据其口述当夜全部工程师彻夜加班。 今日(2014/3/27,大概下午5点)于论坛发了一则公告,态度还是非常良好的。

新浪云:sae.sina.com.cn/
阿里云:aliyun.com/
百度云:yun.baidu.com/
谷歌云:developers.google.com/a
亚马逊云:aws.amazon.com/
共同点是都带一个云字
大体的功能就是一个网络备份功能的软件...
posted @ 2014-03-28 23:09  zhangyongjian  阅读(387)  评论(0编辑  收藏  举报