阿里云观察——阿里云总裁王坚专访

文 / 《程序员》总编辑  刘江

2011年底,我走访了阿里云计算公司在杭州的总部,与掌门人王坚博士及其核心团队成员有较长时间的对话,第一次近距离接触阿里云。那时,阿里云在移动操作系统和云计算平台两大正面战场双线作战,布局宏大,而成绩还没太见到,来自内外的质疑颇多。我随后写出的《追寻凌云梦》(见《凌云》第一期)一文最后总结说:“阿里云的战略方向是正确的,自主研发核心系统的勇气也令人敬佩。”

但当时我也看到,阿里云在技术和业务两方面困难都不小,王坚及其团队都承受着巨大的压力,所谓前途光明、道路曲折。事实上,按王坚自己的话说,从2008年10月开始写阿里云平台第一行代码,就走上了不归路,最初创始的几十人历经几次架构大改,已经“死”了几批,坚持下来的已经不到十个。

进入2012年,全球范围内Google、Apple、Facebook和Amazon几大巨头之间从硬件到软件、从移动到云计算平台、从应用开发者到数字媒体内容发行等整个生态环境的全面竞争成为IT行业的主旋律,国内各大互联网企业和IT厂商在各大入口、搜索、云计算、开放平台、电子商务、支付等领域的明争暗战也此起彼伏。这些都从某种意义上说明,像阿里这样规模的平台企业,多个方向的正面战争其实势所难免。

2012年,互联网公司做手机成为热潮,阿里云被媒体关注的焦点也始终是云OS这个手机操作系统。与天语的合作与分手,与海尔的合作,直到9月与宏碁的合作因来自Google的压力而搁浅。不久,云OS从阿里云公司独立,合作的手机厂商中也开始出现比较草根的北斗小辣椒和原来主要面向海外的乐丰(它们的注册商标很有意思,是Lephone)这样的品牌。

而媒体聚光灯外,阿里的云计算业务进展顺利,无论按规模还是产品线已经成为中国的行业领导者。在2012年11月9日的阿里云开发者大会期间,我与王坚博士再次对话。他透露已经有数万个网站、应用和游戏建在阿里云之上,支撑过亿用户访问。在阿里云宣传材料中,客户名单里既包括联想、施耐德、创维、中软国际、中国网络电视台、DeNA这样的国内外大企业,也有虾米、唱吧、周末画报、ifanr等众多移动和互联网新锐公司,还有阿里集团内部的聚石塔(淘宝和天猫的开放平台)、冰火鸟(阿里集团的统一数据平台)、阿里金融和雅虎中国邮箱等海量用户的应用。由弹性计算、存储和数据服务、大规模计算、云引擎等产品与服务,涵盖IaaS、PaaS和SaaS,丰富的产品线也成为用户选择阿里云的主要原因之一。

(原文链接

紧接着的淘宝天猫“双十一购物狂欢节”,191亿元交易额中,有20%的订单处理由阿里云承担,而阿里云支撑的聚石塔更是为节日中不少创了记录的商家立下汗马功劳。

从服务网商到赋能开发商:阿里的云计算基因

阿里云能达到这样的地位当然并不令人意外,阿里的资源、品牌号召力和实力在那里。无论是资金投入还是多年的基础设施和技术积累,包括运营商级别的骨干网络、BGP带宽和国内领先的CDN网络,还有万网多年的服务经验,都是目前其他云计算提供商无法匹敌的。

然而,阿里云的领先其实从某种意义上也反映出中国云计算的尴尬现状。我们知道,全球范围内云计算平台最成功的案例是Amazon的AWS,主要通过公共IaaS的建设与运营,并逐步向PaaS扩展,已经建立起繁荣的生态系统,为美国移动和互联网近年来一大批新兴创业公司的崛起提供了坚实的基础设施,起到了至关重要的作用。

而在国内,云计算表面上虽然热火朝天,中国电子学会与CSDN合办的标志性活动“第四届中国云计算大会”已经将2012年称为“中国云计算实践元年”,但除了政府支持下的“数据中心建设热”之外,真正像阿里这样坚决投入通用公共云计算的,其实屈指可数。最明显的证据,就是曾有业内人士点评国内云计算时认为,第一阵营中有三家企业,阿里云和万网就占据了两席。其他有相当实力的企业虽然也有云计算的项目,却大多选择了紧贴自身业务、服务垂直性开放平台的路子。即使模式上最像Amazon的盛大云,最近也开始更多地将资源投到视频等垂直领域,并将自己的定位转向盛大内部内容资源的分发、支付与用户数据管理。

对此,王坚在访谈中透露,阿里最初准备成立云计算公司时,他其实很想将公司名称定为“通用计算公司”。与通用电气实现了电气化一样,阿里云从第一天起要做的就是通用计算。而大部分公司还是低估了通用云计算的技术和提供有竞争力商业服务的难度。在某些垂直领域做,门槛可能会降低,但由此出发要做成一个大规模通用云计算服务平台的可能性则会越来越小。这也是阿里云要自己顶着巨大的风险,不是从现成的开源技术出发,而是选择从零开始自己开发一整套代码,想把Google和Amazon在架构上的优势结合起来的原因所在。今天能够真正提供全面云计算服务的公司不是在增多而是在减少,用户的多样性抬高了云计算的门槛。

王坚这样解释阿里云跟其他开放平台不一样的地方:

“阿里云唯一的业务就是云计算。云计算是有两种,一种是集成在其他业务上的,另一种是不集成在其他业务上的。阿里云是不集成在任何业务上的,只是单纯的云计算。为什么呢?因为只要着眼于业务上,就一定永远是业务的附属品,而用户唯一需要的却是计算能力。因为不集成在任何业务上,所以用户可以在上面开展任何的业务,它是一个真正的开放平台。什么叫开放?这个问题我想了很久,开放就是要让小公司能做大公司的事情,同时也要让大公司能做小公司的事情。这才是我们努力的方向。”

阿里与其他平台为何会有这样的区别?王坚认为是公司的基因使然。在他看来,阿里与生俱来就是一家打抱不平的公司,阿里B2B和淘宝、支付宝,无不是为“小而美”的个人和中小企业等相对弱者提供平台,让它们发挥自己的创造性,开创各种业务,帮助它们发展壮大。

阿里云也是一样。在2012阿里云开发者大会上,王坚的演讲稿只有一页,题目是“开发者·飞天·云OS·开发者”。演讲的第一句话是:“在我眼里没有领导,也没有嘉宾,只有一个人,就是开发者。”在解释为什么阿里云要在开发者社区投入这么多资源,举行阿里云开发者大赛、阿里云开发者大会,并推出开发者认证计划时,王坚的回答是:“因为阿里云就是为开发者而生的。”他更愿意将Developer翻译为开发商,开发商之于阿里云,正如当年网商之于阿里和淘宝。其中的开发商既包括联想、海尔、E人E本、小辣椒、乐丰这样的硬件开发商,也包括广大软件开发者和软件企业。将硬件和软件开发商连接起来,这是阿里做云OS手机操作系统的目的。而阿里云的任务是提供技术和资源支撑,让一个人也可以做之前大公司才能做的事情。而云计算环境也能促使一家传统大公司的业务流程与组织结构发生变革,达到互联网和中小企业的灵活性与效率。“如果没有福特生产线,电是没有价值的。”王坚喜欢将云计算带来的变革与电气化相提并论。电气化改变了诸多行业乃至整个社会的面貌。阿里集团习惯用对整个社会的贡献和影响有多大来评估业务,赢利则是副产品。这正是阿里的基因。

2012:不平静的一年

外界可能并不知道的是,这一年阿里云过得并非一帆风顺。这也是中国云计算实践的缩影。阿里云的第一个云计算服务——云服务器上线,曾经令许多得风气之先的中小开发公司兴奋不已。之前它们后端的选择,要么是国内IDC服务器托管,运维的压力山大;要么是国外的云服务,又不得不忍受网络的龟速。

然而,真正用上云服务器之后,早期用户却发现阿里云平台虽然网络非常出色,但服务并不稳定,故障率偏高,偶尔还会发生数据损失,I/O性能较差更是被诟病最多的地方。这些问题随着平台不断改善都逐渐得到了解决之后,王坚却发现了一个更大的问题:服务意识。

回顾2012年,王坚认为阿里云最大的变化是意识到服务的重要性。阿里云之前的精力主要放在技术研发上,只是在做软件,让平台运行起来。对外提供服务之后,这种思路仍然没有转变过来,加之经验不足,出现了不少服务质量问题。

有一次,王坚听说阿里云的一家做团队协作SaaS服务的小客户TeamCola(彩程设计)因为不满服务质量而选择了离开,询问之后却发现公司里居然没有人知道此事。原来,是阿里云的工作人员仅仅由于TeamCola的某个域名没有完成备案,未经通知就停止了云服务器访问。“即使是最官僚、最传统的IDC在停服之前都会打个电话告知一下,”TeamCola的创始人沈学良后来回忆,“这样的服务意识,彻底摧毁了我们的信心。”王坚为此大发雷霆,并在公司内部做了一次大整顿。他对同事说:“如果我们成为一家傲慢的公司,也就离死亡不远了。”

同时在公司内部,在流程上提高平台组件的产品化程度,更方便用户自助服务。将运维责任明确拆分出去,开发人员把产品交付后,就由运维来维护,两者是背靠背的关系,以提升对外服务质量。此外,增加了产品经理的人数,强调他们与客户的直接沟通。

这次整顿以及后续相应的新产品与服务包括服务器监控、在线自助备案和故障热线电话的上线,阿里云在服务质量方面有了显著改善。据我的观察,在新浪微博上,阿里云的几个官方微博尤其是 @阿里云客户满意中心 对客户抱怨的反应速度和服务态度是所有云计算公司里最好的。许多阿里云的员工也非常活跃,几乎每条有关阿里云的微博下面都有阿里云方面的回应。

这种改善也得到了客户的认可。2012年8月,TeamCola再次将应用迁回阿里云。沈学良在采访中表示:“事实证明,这个决定是正确的。到目前为止,阿里云的正常运行时间一直是100%,我们将把所有的服务都部署到阿里云,也就是把公司的未来放到阿里云的平台之上。”我采访的另一位用户,虽然对阿里云有很大抱怨,但对其服务态度仍然予以肯定。

另外,阿里云没有采用传统IDC的人工销售模式,仅依靠自助服务,业务也实现了快速增长,被王坚认为是2012年另一个重要的收获。由技术布道师而不是对技术和产品不那么了解的市场营销人员针对用户进行产品宣传推广,解答技术问题,起到了很好的效果。

“客户教会了我们非常多东西,甚至改变了我的世界观。”王坚认为2012年的业务发展、客户增加使阿里云获益良多。“是开发者、客户真正在教我们怎么做云计算。”这也是他高度重视开发者大会和社区建设的原因。

来自内部的争议

阿里云的挑战并不只限于外部。接触过王坚的人都能感觉到,他的想法富有前瞻性和战略高度。一个明显的例子就是,阿里云早在2009年成立时就以“打造以数据为中心的先进云计算服务平台”为使命,而那时候大数据在国内还远没有成为热门话题。

在阿里内部,能充分理解王坚想法的人并不多。在知乎上的“王坚是一个怎样的人”问题下面,有不止一个阿里员工表示经常听不懂王坚的话。在阿里采访过程中我还得知,即使是在公司高层,除了马云和战略学教授出身的阿里总参谋长曾鸣之外,也有很多人无法完全跟上王坚的思路,经常需要曾鸣的进一步阐述。

而作为通用计算平台,阿里云曾经最为人质疑的地方,是阿里集团内部没人用。这实际上是在说,没有大的有说服力的内部应用案例。在阿里集团内部,阿里云和其他业务部门的研发团队之间,的确长期存在技术路线之争。其中原因并不难理解。

将集团内部现有的已经垂直优化的核心业务系统,迁移到阿里云这个相对还不那么成熟而且技术体系不易兼容的平台,无论从技术本身还是相关技术人员的感情与利益来说,都存在巨大的挑战和冲突。这种冲突与对王坚本人以及阿里云本身的业务发展情况的评价混合在一起,在阿里内部曾经引起了激烈的争论甚至直言不讳的批评。但王坚和阿里云的战略方向得到了马云的坚定支持。在阿里集团“平台、金融和数据”三大板块中,阿里云显然占据重要位置

2012年8月,王坚被任命为阿里巴巴集团首席技术官兼任阿里云总裁,在云计算业务之外,同时全面负责规划、制定和实施集团技术发展战略。马云曾在内部论坛上发文“我心目中的王坚博士”,文中有这样的力挺:“王坚的长处不是很多人能懂的……如果阿里巴巴十年前就有他,公司今天的技术可能会很不一样。”这一任命实际上决定了阿里云将在集团各业务部门未来的技术研发方向上发挥更重要的作用。

此外,之前阿里云和万网在云主机业务上的重叠,也随着万网并入阿里云,成为域名品牌而得到解决。阿里云发展的两大障碍已经解除。

未来的机遇与挑战

应该说阿里有做云计算得天独厚的条件。基础平台型的云计算,注定将是长线项目,靠长期投入,集沙成塔,由量变最终促成质变。而这正符合阿里的基因。2011年采访时,王坚曾表示,集团对云计算有足够的耐心和坚持,马云本人是铁杆的支持者,“有这么幸福的环境,如果还做不成的话,只能说是我们这帮人无能。”

从大环境来说,阿里云在国内目前没有真正的对手,2013年将继续享受较长时间的机遇窗口。互联网同行里,像阿里这样同时具备了决心和实力的,还没有第二家。而IT厂商和电信运营商虽然也都有自己的优势,但想同时补上平台技术能力、运维和运营经验的短板,挑战巨大。国外的微软和Amazon即使能顺利进入中国并提供服务,但要想具备相当的竞争力和品牌号召力,还需要时间。正因为如此,有一位做技术的朋友对阿里云目前的技术水平虽然评价不高,但仍将网站架构在阿里云上,因为别无选择,“其他的更差”。

阿里云面临的挑战也显而易见。中国特殊的监管环境和网络环境都是。而作为一个新兴行业的开拓者,他们要解决众多前人没有遇到的问题。阿里集团内部各业务线的技术与阿里云的整合能否顺利,也值得关注。如果在某一核心业务迁移到阿里云的过程中出现严重失误,对阿里云的发展将是巨大挫折。

宏观来看,云计算行业本身的商业模式,在中国这样的环境下,还不是特别明确。即使是看上去红红火火的Amazon云计算平台,在迅速发展超过十年之后,业界分析2012年的营收也不过在20亿美元水平,利润也不高。相比之下,Apple可能用少得多的资源支撑一个iTunes+iCloud,营收和利润都要好得多。这种机会成本的诱惑,对阿里云能否坚持目前的战略,持续投入,改善产品和服务,可能是更严峻的隐性挑战。

全球范围内,Amazon云计算对整个新兴产业的发展无疑举足轻重。对于中国来说,阿里云的成败也有类似的份量。让我们祝福阿里云。

posted @ 2017-09-12 17:04  《在线》  阅读(718)  评论(0编辑  收藏  举报