云计算之路-阿里云上:节能降耗,希望从此好天气
现在每天早上起来,最关心的就是阿里云上的天气。可是,中国气象台的天气预报中没有阿里云。于是,只能默默祈祷:蓝天蓝天蓝天。但是,事与愿违,上周还是出现了三天晴转乌云的天气。看来,仅仅祈祷是解决不了问题的。
天气不好,我们不能仅仅责怪乌云,也许乌云的一部分原因是空气污染。除了吐槽、祈祷之外,我们更要通过自身的行动——节能降耗——减少乌云产生的机率。
要做好节能降耗,首先要对症下药。根据上周故障期间对其他可能原因的排除,以及对故障现象的认真分析,我们确信问题肯定与虚拟机的CPU有关。故障期间,网站响应速度很慢,是因为处理用户请求的线程拿不到应有的CPU资源(表现为CPU占用接近0%)而卡在那里。为什么拿不到应有的CPU资源呢?我们猜测有两个可能的原因:1. CPU资源被同一个集群上的其他虚拟机抢占;2. 阿里云底层虚拟化系统认为我们能耗大(CPU占用高),在短时间内故意不分配CPU给我们(依据是在CPU占用接近0%之前,CPU占用接近100%)。
不管是被抢占,还是被限制,但问题总是发生在并发请求多的访问高峰期(CPU消耗大)。也就是说故障发生率与CPU占用率成正比,只要减少CPU占用率,自然就会减少故障发生率。这也是通过我们自身的力量改善天气唯一可以做的地方。
目前我们已经完成了第一阶段的优化工作——优化正则表达式的处理(正则表达式是耗CPU的大户)。
接下来,我们还要进行一系列节能降耗的优化工作,有些涉及到程序的大改动。
当初决定走上云计算之路,我们没有给自己留退路,迎难而上、解决问题是我们的唯一选择。
当刚发明电的时候,正因为很多有信念的人解决了发电、输电、用电中的各种问题,才开启了电气时代;同样,云计算时代不是等来的,不是抱怨出来的,而是通过解决无数个问题之后开创出来的。
云计算之路,希望得到大家的更多理解与支持!