云计算之路-阿里云上:3月5日下午出现的异常情况
“云计算之路-阿里云上”的系列博客主要分享的是我们使用阿里云的真实情况。
自从去年9月1日之后,我们开始稳定地用上了阿里云,直到今天下午出现了异常情况,继续向大家汇报一下。
博客主站的Web服务器部署情况是这样的:1个SLB下面挂了2台8核8G的云服务器,1台用的是云磁盘,1台用的是临时磁盘(本地磁盘)。
今天下午其中的带云磁盘的云服务器出现了很不稳定的波动情况,下面是Windows性能监视器的截图:
上图红色表示的是CPU占用情况,绿色表示的是IIS的当前连接数(由于TCP连接由SLB负责保持,正常情况下这个数值很低),紫色的是ASP.NET应用程序中的请求执行时间——这个直接反映当前应用程序的处理性能。上图中这样的波动与平时正常情况相比,已经是很糟糕的情况。
再对比一下另外1台使用临时磁盘的云服务器的表现要好很多,见下图:
向阿里云提交工单之后,他们在底层没查出异常情况。
根据我们的分析,这个问题可能是最近更高的并发触发的,带云磁盘的云服务器在处理高并发的能力上更弱一些。
目前我们采取的解决方法是另外购买1台带临时磁盘的云服务器替换掉带云磁盘的云服务器。
但带临时磁盘的云服务器有个不方便之处,无法升级/降级服务器的硬件配置。
为了性能牺牲扩展性,目前是不得已为之。还是希望阿里云能进一步提高带云磁盘的云服务器在高并发下的处理性能,或者提供其他更好的解决方案。