追寻凌云梦——对话阿里云总裁王坚
文 / 刘江
王坚其人
被同事习惯地称为“博士”的王坚是一位颇具传奇色彩的技术领袖。这位1962年出生的杭州本地人个子却很高,学者气十足,说话思维敏捷,声音洪亮。小时候成绩并不出众的他,长大后却成为博学广识而有独特思维模式的怪才。
加入阿里巴巴以前,他曾经是声名显赫的微软亚洲研究院常务副院长,负责过用户界面、机器学习、大规模数据处理、广告平台、无缝个人计算等诸多看上去非常发散的项目。他主持发明的数字墨水技术、数字笔和手写数学公式识别器等都是名噪一时的学术成果。更令人称奇的是,他居然是心理学科班出身,在杭州大学从本科读到博士,短时间在国外进修后,又回到母校任教,先后担任教授、博士生导师和心理学系主任。而他当年进入微软研究院时的身份却是国内人机界面第一人。
与大多数同龄人不同,王坚敢想敢做,没有太多顾忌,思维方式很像美国人。《追随智慧》一书中曾爆料,当年他之所以接受李开复的邀请加盟微软,动因竟是因为老开会烦了,又不想当学校指定的理学院副院长。而他第一次见到李开复时,开口就批评后者参与开发的苹果系统和微软的Windows用户界面都很糟糕……
相比阿里巴巴旗下人人皆知的淘宝、支付宝等子公司,组建于2009年9月10日的阿里云要低调得多。也许因为恰逢阿里巴巴集团成立十周年,庆典的宣传太过火爆,外界很多人当时要么压根儿没留意到这个新公司的诞生,要么就将它与阿里软件混为一谈了。
此后,除了2009年底大批招聘技术人员见诸报道之外,阿里云似乎一度从人们视野中消失。即使是在云计算已经成为业界焦点、如火如荼的2010年,也未见阿里云有较大动作。原定2010年底的发布迟至2011年上半年将尽仍然不见动静。而在此前后,阿里云庞大的布局曝光——分布式计算系统、分布式数据库、手机操作系统、浏览器、输入法、搜索、地图、邮件、翻译……引起技术圈内激烈争论,豪华团队、投资巨大、研发受阻、前途未卜等等有关阿里云的传言也越来越多。更有前阿里员工甚至直斥阿里云不靠谱、纯忽悠。
2011年7月,联手天语推出的阿里云手机迅速成为媒体焦点,总体上外界的评价是毁誉参半。10月24日,阿里云首次开发者大会召开,弹性计算平台、开放数据处理服务、ACE平台、云应用平台、开放存储服务和CDN、开放结构化数据服务等全线产品首次全面发布。此后阿里云喜讯不断,先与日本游戏平台DeNA达成战略合作,后又获得政府亿元资金支持。
但围绕着阿里云的疑问仍然不绝于耳。一个电子商务公司为什么要同时做云计算和移动操作系统?为什么一开始就做这么全面的布局?在中国这个市场里如何靠云计算赢利?三年时间里阿里云荟萃的众多技术精英到底做了些什么?带着这些问题,在12月28日,我专门飞到杭州,对话阿里云掌门人王坚。
平台之梦
位于杭州文二路西湖国际科技大厦的阿里云公司办公场所面积很大,充满活力,满眼都是朝气蓬勃的技术人员。据介绍,目前公司已经有1200人,其中八九成都是工程师,包括中国第一个ACM-ICPC冠军队成员林晨曦在内的一批技术骨干,分别负责基础平台、基础服务、云计算业务、云手机四块,公司没有销售。
世界范围内,云计算的领导性厂商,技术上是Google,而业务上则是Amazon。Amazon Web Services目前已经渐渐成为主流,不仅是众多创业公司的首选,也是Netflix、DropBox、Zynga等行业新贵们崛起的幕后英雄,已经实现数亿美元的营收而且潜力巨大。而在中国,对应的市场仍然基本上是一片空白。在平台征战的时代,这块业务是当然的制高点,其重要性不言而喻。
阿里巴巴是中国与Amazon最接近甚至在电子商务方面布局更全面的公司,它的资源实力毋庸置疑,而外界不大了解的是,其技术能力在业界也是领先的。因此,阿里投身做云计算,逐鹿平台之战,并不奇怪,但阿里的雄心仍然令我吃惊。王坚介绍,从战略上来说,他们想做的事情实际上可以解读为Amazon+Google并有所超越。Amazon最重要的贡献是真正实现了计算的Utility化,而Google真正从技术上把计算的规模做上去了。这两点阿里云都要做,即用Google模式的技术来做Amazon模式的运营,而同时还在慢慢努力做的一件事情,是数据,要为人人提供全网规模的数据与计算。也就是说,如果你今天愿意,就可以做一个全网规模上的搜索引擎,计算和数据不再是你的约束。
阿里云对自己使命的表述方式颇有点与众不同——打造以数据为中心的先进云计算服务平台。在对话中王坚不无自豪地表示,三年前公司成立的这个初衷,现在一个字都不用改。他们当初对云计算的理解和判断基本上仍然是成立的。
为什么这么强调数据?王坚认为,数据将成为对国家和企业至关重要的战略性资源。而且,是近年来发生的一个革命性变化——数据都是在线搜集完成的,从不在线到在线,使数据真正具有了战略价值。与他的说法可以相互印证的是,全球范围内Big Data也成为业界大热词,有国外观察者称数据将成为新时代的石油。
另一个要素——计算能力,也是国家和企业绝对的核心竞争力。Google是一个很好的例子,它实际上是把一个本来是大家公共的数据变成独有的,然后在这上面创造了一个巨大的企业。相当于6千米海底下的石油,理论上是大家的,但别人都没有能力打,只有Google有这个技术能挖掘其中的价值。而阿里云的愿景是做中国拥有最大计算能力(而不是服务器最多)的公司。
阿里云的业务模式有两种,一种是数据中心和技术、运营都由阿里云负责,一种是数据中心和服务器是客户的,阿里云负责技术和运营,与客户分享收入。后一种模式已经有好几家公司在尝试,王坚预计后一种可能利润更高。
超越Hadoop
王坚在对话中多次强调,阿里云战略上最与众不同之处,就是坚持追求拥有自己的具有竞争力的核心技术。而且,经过三年艰难地技术攻关,数次推倒重来,终于跨过了这个技术门槛,依靠自己的技术力量实现了飞天(Apsara)这个非常扎实的通用大规模分布式计算系统,它除了MapReduce之外,还支持最广泛的各种编程模型。而且,阿里云技术人员在这个统一平台上实现了电子邮件、搜索、地图、弹性计算、数据处理等众多功能,也就是说邮件和搜索底层是一样的,除他们外,在世界上只有Google能够做到这一点。
说到这里,王坚有些动情:“这其中有很多具体的技术难题,有的非常难,比如调度那一块,就让开发团队吃了不少苦头。你不做到那个层次,根本不会知道其中奥秘。一开始很多人都不相信我们能够做出来。但我们成功做出来了,对此我完全有理由感到自豪。”
我们都知道中国公司很少会选择冒很大风险自己从事这种底层的自主研发,当时这一决策是怎么做出的呢?难道不怕最后搞砸了无法交待?
王坚回答,做平台必须面对正面战场,这是绕不过去的,打游击战、平型关大捷什么的没有用,无法结束战争。幸运的是,团队的内外部环境非常好:集团对此有足够的耐心和坚持,马云本人是铁杆的支持者,集团CFO也说过钱不是问题的话,其他子公司的友情支持,加上有一批铁杆的员工,还有来自万网这样铁杆用户的支持。他直言:“有这么幸福的环境,如果还做不成的话,只能说是我们这帮人无能。”
处于核心的飞天系统的研发成功之后,阿里云终于一扫之前的阴霾,各种上层产品源源不断地发布。
我又提出一个早已准备好的问题:为什么不直接用Hadoop呢?王坚回答:“大家都会觉得,直接用Hadoop不是很好更快吗。Hadoop当然在离线大数据处理上很有价值,但它无法解决我们公司公共云计算服务的问题,因为我们已经上线的云服务,已远远超出Hadoop的能力,这和公司的定位是有关系的。今天飞天已很好地支持了阿里云的各类业务,其中也包括了大数据处理,从这个意义上讲,飞天实际上已经超越了Hadoop。”
他还补充说,现在号称做云计算的公司很多,实际上其中的技术门槛是非常高的,很少有公司具备这样的实力。一些企业搞一百台服务器就做网盘、云存储,还有所谓的私有云,把一个企业解决方案放大就说是云计算,说实话,这些真不能算。此外,通用的云系统比垂直、专用的要难得多,虽然单看某个具体的应用效率上后者可能还是会有优势,但整个平台规模效益一上来,结果就完全不同了。
有了坚实的底层技术做支撑,阿里云就有信心在规模效益和成本上取得竞争优势。王坚举了一个让他最感自豪的实验案例,在一个1500台组成的数据处理集群上,一边处理数据的同时,还可以溜进去几个作业,完成动画渲染,实际上相当于渲染是免费的。
与此同时,云计算除了解决基础设施需求之外,必须给客户提供更多价值,比如搜索等服务,比如能给客户带来用户,降低用户获取成本。
拨开迷雾
问:在已经有很多业务的互联网公司做通用云计算平台,都会遇到平台与业务关系之间的矛盾。之前外界对阿里云的很多质疑也是说阿里云的研发不跟具体的业务结合,阿里集团自己内部也不怎么用。阿里云目前的情况如何?又是怎么解决相关问题的呢?
王坚介绍:“目前集团内外都有很多成功案例,平台接入的直接客户接近5000家。其中包括集团内部的整个邮箱。万网更是铁杆用户,在我们发展早期帮过大忙。他们第一天上线时,客服电话都被打爆了,而到现在几乎各种有竞争力的功能都是我们在后面支撑。阿里金融是联合运营的例子。淘宝的对外数据业务和开放平台也会建在阿里云平台上。还有ShopEx等外部的客户也跑在我们的平台上。类似的例子还有很多。”
在平台和现有业务之间,阿里云有过经验教训,中间有一个痛苦的转变过程。最开始,阿里云同时还承担集团技术部门的角色,要兼顾公司内部和面向外部的平台开放,一度非常纠结。支持集团内部业务与真正面对公众的开放云计算平台之间差异还是很大的。王坚说,看到Google虽然技术领先但在与Amazon的竞争中处于下风之后,坚定了外部服务和内部服务各有专注的看法。内部服务现在专门成立了集团技术部,由刘振飞负责。而阿里云将完全转变为专注对外业务,即使是集团内部的公司,也要按两家公司结算,分享营收。
问:阿里云本来应该是专注于平台的,为什么会想到去做云手机?之后的路线图是怎么样的?
王坚坦言,的确这一年同时在打两个正面战场,很辛苦,但移动终端也是一个绕不过去的正面战场,靠做应用无法解决所有问题。这个决策主要是从阿里巴巴集团战略的角度出发的,不能失去这么大的一个机遇。内部各公司中阿里云最有条件去做这一块。而且,战略上移动互联网和云计算是不可分的,如果你的云计算只是在传统互联网上成功的话,其实还不能算成功。云计算生根不是在移动互联网上,但开花结果会在移动互联网上。某种意义上阿里云在概念上是非常紧密的两家公司。但在云平台方面,对其他终端系统也是开放的。
下一步基本上每两三个月会有一个新的版本,2012年1月会出手机云OS 2012版,这一版在用户体验上有了很大提高。同时,已经开始在谈第二个手机厂家,天语也会出更多的型号,支持高端和低端,还有平板。但最重要的,是把互联网运营的思想带到手机上去。现在路子已经趟出来了,就是有三个系统:终端操作系统、云端系统,还有运营手机的系统,比如应用商店之类。
问:就目前来讲,你给阿里云打分打多少分?
“从个人角度,”王坚回答,“打两个分比较客观。必须承认正面战场是很难的,就阿里云自己今天走到这一步而言,我觉得可以打90分。但从让别人满意来看,我觉得打不到60分。确实由于能力所限,还有很多需要改进的地方。”
问:你预计阿里云过几年能够像Amazon那样成为盈利部门?
王坚确认,从集团角度阿里云会持续投入,一年十个亿,基本上要做十年。但阿里云有可能在12个月到24个月以内实现盈利。现在公司可以不再增加一个人,收入却不断稳定增加。“我的第一个目标,是阿里云给集团外部提供服务所需的计算资源,要超过集团内部,这个目标已经是可以预见的。而第二个目标,是我们的计算规模能够与Amazon相提并论,相信一定不会花十年的时间。”
阿里云的战略方向是正确的,自主研发核心系统的勇气也令人敬佩。从CSDN最近与阿里云平台的合作来看,产品值得信赖。阿里云公司杭州办公区的前台有一副对联相信给所有访客都留下了深刻印象:梦想永在凌云意意气风发,代码成就万事基积沙镇海。让我们祝福阿里云。
(作者:程序员杂志 刘江,原文链接)