阿里云崩了,总结我们从云上搬到线下经历了什么
我们做钢铁行业云的时候,也曾购买过某讯的云服务器。当时某讯做活动,头3年比较便宜,大概买了40台左右云服务器。
但是,3年期间使用云服务器的经历,体验并不好:1.我们云服务器的密码都是随机生成的,专门有一个密码表,自己运维的时候都很容易输入密码错误,尽管这样也经常被攻击。2.经常中挖掘病毒,CPU使用率超负荷,并且影响我们自己的服务运行。3.夜间远程运维的时候,明显网络带宽有降速的情况,尽管没有和白天真正进行了数据对比,但是自身感觉使用过程中明显速度变慢了。反馈给云服务器代理商,一般会推荐购买云安全产品,但是我们一直没有购买。
云服务器3年使用快到期后,我们决定把钢铁行业云的所有服务和系统搬到线下。自己找了一个IDC厂场,机架、电源、空调等配套齐全。我们自己购买服务器、防火墙、交换机等基本设备,自己做虚拟化管理。搬到线下也有2年左右的时间,除了一次IDC机房断电,没有出现过其他情况,所有服务器运行正常。
购买云服务器,头3年做活动是便宜一些,但是过了3年期,好一些的服务器配置一年期至少得5000元以上,按40台服务器计算,1年的云服务器的成本至少在20万左右。我们搬到线下,花了将过100万买基础硬件资源,租实体IDC机房1年期大概是22万左右。搬到线下有好处是:有硬件的固定资产、锻炼团队、完全自主可控(想怎么玩就怎么玩)等。但是,面临一个抉择的问题,上云3年了,数据和服务都在云上了,过了3年期之后,还有没有勇气搬到线下,大量数据在云上,迁移到云下还得需要专线下载,因为原来购买云服务的带宽不足以支撑下载大量数据,还得花一部分费用。
其实不是所有企业都适合上云的,像我们这样的企业做行业云服务,有点规模、提供在线实时服务、但是又不能快速扩张,就不太适合上云服务,因为不太受控。适合上云服务的两类企业:1.大型企业,规模化购买云服务,和云厂家有议价的空间和谈服务的资本;2.小型企业,使用云服务的规模比较小,有问题也无所谓。
上不上云是企业发展阶段性的选择,从任何角度来看任何云服务都不可能做到百分之百没有问题,有技术问题、有人的问题、有管理的问题。阿里云崩了,那也只能是双方共同承担。
总之,这次阿里去故障,肯定要引起重视,前段时间刚刚上《新闻联播》,又刚过双11,不太好看。
案例:博客园使用的是阿里的云服务,今年第6次CPU 100%故障。我们的iNeuOS工业互联网平台演示系统是部署在阿里云服务器,也出现过3次左右的CPU 100%的问题,经过排查,是厂家云服务器自带一个监测进程的CPU使用过高导致的,手动结束这个进程或是重启服务器可以解决这个问题。不知道博客园CPU 100%故障是不是有这方面的影响。
物联网&大数据技术 QQ群:54256083
物联网&大数据项目 QQ群:727664080
QQ:504547114
微信:wxzz0151
博客:https://www.cnblogs.com/lsjwq
微信公众号:iNeuOS