云计算之路-阿里云上:5月1日下午飘过的一朵乌云

云计算之路更多分享的是我们遇到的实际问题,我们觉得实际问题更具分享价值,更能让人从中受到启发、学到东西。而且通过如何面对问题、解决问题可以更深入地了解我们所在的“云”未来是否可以长期定居。

4月26日“乌云变成蓝天”的希望成为了现实。当有人怀疑乌云是应用程序引起的时候,我们未改一行代码就解决了问题。当有人谴责我们总是怀疑云平台的问题时,实际我们在怀疑之前已经对应用程序进行了排查。

对于云平台的问题,我们喜欢小题大作,因为它影响的不是我们一家网站,而是云上成千上万的网站,而这些网站服务着成万上亿的用户。

5月1日下午17:22~17:32,蓝天之下,飘过了一朵乌云。感谢两位园友看到了乌云并向我们反馈!我们通过多个监测数据确认了这朵乌云。

1. 监控宝

2. 阿里云云监控

3. Windows性能监视器

通过监测数据,可以知道当时无法连接负载均衡(SLB)的80端口(监控宝与阿里云云监控),SLB中的云服务器未收到来自SLB的请求(Windows性能监视器),使用这台SLB的博客站点当然就无法访问。

确认了故障后,我们向阿里云提交了工单,得到的反馈是那段时间这台SLB发生了瞬时大流量导致Proxy offline(简单来说SLB相当于一个反向代理,所有请求先到SLB,再由SLB转发给云服务器),SLB与云服务器之间无流量。具体是什么原因导致了瞬时大流量,阿里云技术人员还在进一步排查。

希望阿里云早日排查出问题的真正原因,SLB的任何问题都不容小觑,因为SLB的故障是单点故障。

posted @ 2013-05-02 18:43  博客园团队  阅读(4246)  评论(39编辑  收藏  举报