处理器芯片系列:群雄逐鹿,谁主沉浮(一)

本文原创首发于微信公众号:霁月清空,欢迎关注公众号获取最新内容。

原文链接:处理器芯片系列之一:群雄逐鹿,谁主沉浮 (qq.com)

 

CPU、GPU、FPGA,DPU,ASIC,TPU……这是最坏的时代,群雄争霸,烽烟四起,闹哄哄你方唱罢我登场;这是最好的时代,大争之世,千秋功业,还看今朝!

 

滚滚长江东逝水,浪花淘尽英雄。是非成败转头空。

青山依旧在,几度夕阳红。

白发渔樵江渚上,惯看秋月春风。一壶浊酒喜相逢。

古今多少事,都付笑谈中。

——临江仙明-杨慎

 

2015年Intel以167亿美元收购Altera;2020年AMD以350亿美元收购Xilinx;2020年NVIDIA宣布将以400亿美元收购ARM(2022年收购失败)。这一系列让人眼花缭乱的收购意味着历史已经从春秋争霸进入了战国兼并时代。有意思的是,现在留在台面上的这几家基本上可以跟战国七雄一一对应。

  1. 魏国+韩国—— Intel+Altera

从战国初期来看,要问谁最有一统天下的可能,答案一定是魏国。当时魏国拥有的四大区域是:河西囊括崤函地区,秦国被压制在华山以西无险可守地带;河东出产盐铁,那就是现在的黄金石油,钱是不用愁的;河内土壤肥沃;河外掌控豫西和豫北通道,是连接战国四大板块关中、山西、河北、中原的关键交通线,在后世一千年内都被称为华夏最重要的地理通道。

几年前说起CPU,大家的脑子伴随着“灯,等等等等”这一熟悉的旋律,应该会浮现出一个图标。那时,Intel的CPU在台式机和服务器的市场占有率达到80%,甚至还一度超过90%,真可谓雄霸天下,指东喝西,好不威风!

 

曾几何时Intel跟魏国一样手握崤函天险,占据最富庶的土地,与另一个领域的霸主联手,建立庞大的Wintel阵线联盟(Windows+Intel),笑傲江湖。现如今,廉颇老矣,尚能饭否?

 

  1. 1 二十一世纪最贵的是什么——人才

看战国历史,总是忍不住替魏国惋惜,有多少大才曾经在魏国工作过:李悝、吴起、商鞅、孙膑、范雎、乐毅。

成立半个多世纪的Intel也不乏名人:罗伯特.诺伊斯(让集成电路走向商用)、戈登.摩尔(大名鼎鼎的摩尔定律)、安迪.格鲁夫(战略转型微处理器)、格伦.辛顿(Nehalem CPU内核首席架构师)。当然作为处理器芯片设计的霸主,Intel也延揽了很多其他国家/公司的设计达人,如VladimirPentkovski(从前苏联移民美国,将超标量引入Intel微架构)、硅仙人吉姆.凯勒(前AMD首席核心架构师)、杰夫.威尔克斯(前苹果M1芯片首席架构师)等等。

这也可以理解,谁不想往北京上海这样的大城市跑。说到这儿,歪个楼,浅论一下应该选择当鸡头还是凤尾。从对个人成长来说做凤尾更有益,只有到强手如云的阵营里,观摩顶尖高手的做事方法,思维习惯,才有可能成长为像他们一样的高手(注意只是有可能,不是必然)。这个过程会非常的艰辛,挑战很多,打击也很多,而且哪怕你做了最大的努力最后还是可能被淹没。徐庶到曹营没有明显作为,不是什么鬼扯的身在曹营心在汉,只是因为能人太多凸显不出来而已。不过即便被淹没,看看自己最终能成长到哪里,开阔开阔眼界也是好的,至少老了吹牛时,不会只有年轻时的饭量可以夸耀。选择做鸡头,确实容易凸显自己的才干,获得极大的满足感和虚荣心。但山中无老虎,猴子称大王,周围环绕的都是不如自己的人,左右也不过一猴头(不要拿孙悟空说事儿,老孙也是拜了牛人学了本事才完成的从猴到神的转变)。当然如果你本身已经是独孤求败那样的顶尖高手,就不存在选择问题了,挽狂澜于既倒,扶大厦之将倾,建立彪炳千秋的功业才符合你的身份。

大海航行靠舵手,将帅无能,累死三军。诺贝尔物理奖得主朗道把物理学家分为五个等级,每一个等级的能力和贡献都是下一级的十倍。按照这个比例,从士兵到将军大概有六级,从一个小兵到统率十多万员工的老总,这个万人之上的总监最重要的是什么?——答案只有一个,就是战略眼光,其他的什么道德品质,生活作风问题等等都不重要。

魏国从战国老大变成倒数第二,根本原因就是战略眼光出问题了。

 

 如果魏国能一直把重心放在拓展河西势力范围,先凭借河西和崤函天险将关中平原变成自己的后方粮仓,把老秦人撵到陇西给自己养马,既得陇复望蜀,继续拿下汉中盆地、四川盆地,再添两座粮仓,接着凭借汉江、长江的上游优势攻楚,如此一来,天下岂非魏国一统?可是魏国把战略中心放到了河内(图中标红星处),在拓展河内的消耗战中,失去了重中之重的河西之地,之后的一切就都跟他无关了。河内虽然富庶,但四个方向无险可守,周边被列国环绕,想拓展河内得不停的跟周边国家死磕,在没有压倒性力量优势的时候,一打六,只会耗尽自己的国库;可是拓展河西只需要打当时很落后的秦国,攻秦不会引来东方列国的注意,虽然看似绕了个圈子,却是最终王霸天下的正确选择。

一个优秀的CEO要有眼光指明公司正确的发展方向,而不是推导E=MC2,彰显个人的智商优势(不过说实在的,爱因斯坦得出质能方程并不在于使用了多繁复的数学技巧,爱因斯坦的伟大之处在于在那么多可变因子中,敏锐的抓住了光速这个不变量。让一百个人在光速和时间谁是不变量的选择中,有一百个都会选择时间,这多符合直觉,根本毋庸置疑。爱因斯坦是第一百零一个,并由此建立了辉煌的相对论帝国。在已知光速不变的前提下,去推导质能方程,不过是体力活,不知道有什么值得一个物理学博士炫耀的?真想做事,还不如用物理学第一性原理把自己网站上那些花里胡哨有颜色的东西好好清理清理)。

历史是少数人决定的,公司未来几十年的发展也是由少数人决定的,正如郭士纳之于IBM,乔布斯之于苹果,Intel从存储器成功转型微处理器也得益于CEO格鲁夫。现在看起来这一决策似乎是理所当然的,但时间回溯到1985年,这其实是一个非常艰难和残酷的过程。当时Intel在处理器上并无技术优势,推出的386处理器更是遭到学术界普遍嘲讽,面对的是Motorola、DEC、Sun这样强劲的对手。1986年,Intel关闭了八家工厂中的七家,裁员超过七千人,占员工总数三分之一,并迎来自公司创建以来第一次亏损。后来的发展我们也看到了,格鲁夫与比尔.盖茨联手创建的Wintel联盟,奠定了Intel在PC领域的霸主地位。时光荏苒,历史又来到了交叉路口,但是Intel已再无格鲁夫。

 

1.2 经济实力

叫你们看看啥叫不差钱!

分析师:摩尔定律遇到瓶颈了,异构计算是个选项,FPGA可以考虑吗?

老板:买!

分析师:最近神经网络挺热,听说有一家搞AI的startup公司不错

老板:买!

分析师:计算机视觉

老板:买!

分析师:自动驾驶

老板:买!

分析师:前面买的那个AI搞不出来了,现在有个更好的

老板:买,买,买!

廉颇虽老,牙口还不错(¬ -̮ ¬)试错是需要成本的,不过对于Intel来说,错了不要紧(错得还少吗),咱不差钱!如果早些年把Nvidia,ARM这些都买了,世界不就安静了吗?普通公司没有试错的机会,选错一次基本就game over了。普通人辛苦半辈子攒几十万开个餐馆,疫情一来就完蛋了。所以像投胎这种技术还是得苦练,当了富二代,挣它一个亿这种小目标真的不难实现。

也许你会好奇,为什么同一个东西(AI)要反复从外面购买?话说2016年收购Nervana的时候,人家也是AI初创公司中的一条好汉,虽说创始人都是搞软件和算法的,没有真正意义上搞芯片硬件的,但这不正好是Intel的强项吗?按理来说,不应该是强强联手的双赢结局吗?可结果变成了双输,三年都没做出一颗成功的芯片。Nervana固然有其先天缺陷,但Intel内部派系斗争,执行力出问题也负有不可推卸的责任。所以Intel也不折腾了,2019年直接买入已经做出芯片实体而且性能经过验证的Habana。对这个故事感兴趣的朋友,可查看参考资料2的链接。

说到并购,顺道把韩国Altera讲一讲。为什么说它是韩国,从地理位置上,魏韩两家挨得近,Altera在被并购以前,就已经跟Intel眉来眼去很多年了,对于最后的并购大家都不意外。韩国是一个小国家,Altera生产的FPGA在处理器领域份额也不高,但是FPGA这种专用处理芯片就像特种兵一样,拥有这个兵种对Intel的CPU是一种补强。并购后Intel曾打算推出一款芯片,里面封装了x86处理器和FPGA。FPGA作为协处理器,通过两条PCIe和一个UPI通道跟CPU相连。

 

 大概Intel一直对自己的cache技术很自豪,所以想把它们尽可能地运用到其它产品中。就在CPU和FPGA的通道上创造性地加入了一片cache(图中红框部分,通过UPI通道跟CPU连接),看我多牛X,拓展了cache一致性的范畴,现在连FPGA都用上cache了。如果FPGA的用处是到菜市场买菜,会跟老板(CPU)就同一个东西反反复复来回修改价格,那这个cache可能是有用的。但这种工作是FPGA不擅长的,你一定要它做的话,效率会被完全浪费在跟CPU之间来回协商传输数据上,结果远不如CPU自己处理来得快。FPGA更擅长的是从头到尾负责一个完整的功能单元,CPU只要把需要的资源和任务交给它就不用管了。

打个比方说现在有个任务要从一堆人中找出犯罪嫌疑人,每个人只要通过算法一分析就知道是否有嫌疑,这个计算分析的工作很适合FPGA做,于是你把人发过去,然后等着收FPGA的报告就可以了。因为FPGA的计算效率很高,人尽快地过来就可以及早完成任务。可是这些人在去往FPGA的一条高速路上(UPI通道),碰到了一位看门的大爷,他拿出一个小本子(cache),要对经过的人挨个儿进行询问,看他们是否之前登记在自己的小本子里面,然后才放行。问题来了,这位大爷不仅做的是无用功,而且工作效率极低,他人为的制造了一个瓶颈,还不能bypass。没有人过来,FPGA再强也只能干等着。实际使用中UPI这条高速通道就因为加了cache而废掉了,这种做法民间俗称脱裤子放屁!

这就是对FPGA的定位出了问题,所谓将不知兵,兵不知将,还如何打胜战?这么奇葩的事但凡在做架构的时候叫上几个FPGA专家都应该可以避免,可就是发生了!(大概有些专家其实是砖家吧)但是这些并不是不可以修正的错误(大不了先不用UPI通道,用剩下的两条PCIe通道传输),这款产品本身也还处在样片阶段,都还没有给客户试用,完全可以后续进行修正。老大们不知道为什么突然觉得这款产品没有出息,就咔嚓砍掉了!是骡子是马,您倒是先放它出来溜溜呀。对一个新生事物他们做决策倒是挺迅速的!刚说不差钱这会儿又差这点小钱了!

对于亲历其中的人,真不知道是该哭还是该笑!从对这个新宝宝满怀期待,虽然发现它先天不足,还是想办法教它武艺,配好兵器,原指望它施展一番拳脚,证明自己的能力之后配上更好的装备,不料却突然中道崩殂。好一似食尽鸟投林,落了片白茫茫大地真干净!

 

1.3 转折点的关键战役

人生的道路虽然漫长,但要紧处常常只有几步,其实历史也是如此,公司也不例外。战国初年,吴起训练的魏武卒创下大战七十二场,全胜六十四场,剩下八场不分胜负的神话,这个神话在桂陵之战破灭了。魏国围攻赵国,被齐国的孙膑用围魏救赵的方法攻敌所必救,在桂陵设伏,打败魏军。神话破灭之后自然是痛打落水狗,接下来魏国被秦、齐、赵多次痛扁,国力衰退,彻底沦为二流国家。桂陵之战于魏国犹如安史之乱之于唐朝,开启了国家由盛转衰的序幕。

除了个人电脑和服务器,移动智能终端也是一个大市场。早在2004年,Intel就启动了低功耗芯片Atom处理器的研发,剑锋直指ARM。凭借在处理器领域多年的技术和经验积累,研发人员本来可以有机会创造一个完全不同的处理器,开创另一个辉煌的时代。可是他们碰到的不是格鲁夫,不会有哪怕毁掉一切重来的勇气和决心。在战战兢兢,不敢越雷池一步的守成之君手中,奉为圭臬的宝剑是向前兼容,被迫使用复杂指令集的Atom背着这个沉重的包袱饮恨而终。关于Atom的悲歌,在后续分析指令集架构时我们再细看。

我们来看看,差不多同一时间苹果是怎么干的:2005年,乔布斯宣布苹果的Mac将采用Intel x86内核处理器,这一举动让苹果可以多种方式从Intel获益。x86芯片的规模效应会带来价格优势;另一方面,在Mac桌面上可以本地托管Windows应用程序或虚拟化整个Windows系统,这是应对当时如日中天的Wintel联盟不得已的妥协。十五年过去,虽然Windows和x86的兼容性对某些用户仍然很重要,但是对大多数用户而言,这两个功能没那么重要了。2020年苹果Mac正式抛弃Intel,使用自家研发的处理器。在这十五年间,苹果虽然在Mac上采用Intel的x86芯片,但iPhone和iPad等产品一直使用自研的A系列ARM处理器。顶尖高手的隐忍和耐心由此可见一斑,在没有胜券在握的情况下,他们绝不轻举妄动。

手机智能终端领域的战败,从某种意义上来说也是Intel的桂陵之战。Intel现任CEO表示要开发出比苹果自研芯片更好的产品,重新赢回苹果芯片订单。由此也不难理解,2021年Intel计划以20亿美元收购SiFive,SiFive是一家由RISC-V发明者创立的公司。历史已经给过Intel一次机会,还会再给他第二次机会吗?

 

1.4 残酷的竞争机制

众所周知,商鞅变法使秦国走上了强国之路,其中重要的一项是对人的使用,在商鞅律条下只有两种人:农和兵。不种地就扛枪,商人、手工艺者、读诗书的都属于国家蛀虫,全部歇菜,打造出全民皆兵的杀戮机器。

2003年AMD率先推出兼容x86的64位微处理器,丢了面子的Intel,使出杀手锏——钟摆计划tick-tock。tick提升芯片制程工艺,tock在维持相同工艺的前提下,升级微处理器架构。一个tick-tock代表一个完整的芯片开发周期,耗时两年。

 

 站起来两条腿走路的Intel彻底把AMD打趴,直到十多年后一个传奇人物的到来。这个像时钟滴答流逝带着强烈紧迫感的战略,成功的让所有人开始疯狂内卷,短期确实有非常快的迭代效果,但长期来看呢?

先看制程工艺,从65nm到22nm都很好的维持了这个节奏,可是进入到14nm以后,从2015年推出的14nm一直打磨了五年,10nm,7nm更是遥遥无期。随着晶体管密度的增加,功率等问题,每一代工艺难度必然是指数级的上升,延期是必然的。奇怪的是为什么一定要固执地坚持摩尔定律*。根据身高成长定律,人每年会长高6厘米,当这个定律尽忠职守的工作了二十年之后,我们也没有要求它保持下去,甚至认可它到某个程度会出现负增长。尽管摩尔是一位伟大的预言家,但是摩尔定律必然失效,因为它是违背自然规律的。

*所谓摩尔定律是指价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。

面对困境,生命总能找到出路。两条腿不好走了,我们就搞战略发展三步走。在制程和架构的后面增加一步优化。

 

 至此你大概也能猜到后面会发生什么。所谓数不过三,原始人的计数极限是3,3对他们来说代表的是多到数不清的意思。优化是一个无尽的过程,他们还真幽默!

 

 2020年Intel的CEO甚至考虑不再生产芯片,而是将这项业务外包。对此,我只想说还好罗伯特.诺伊斯和安迪.格鲁夫已经去世了。你们这副没出息的模样,让五十年前的创业者们怎么想?

如果说工艺延期是不可避免的自然规律,那架构更新呢?

Nehalem是启动tick-tock计划后具有里程碑意义的架构。

 

 Sandy Bridge是随后tock阶段的架构。

 

 可能你会嘀咕:这看起来跟上一代Nehalem架构没有太大区别吧?但是朋友们,这已经算是有剧烈变化的一代了,宣发时号称是开启了新一代的微架构。后面几代架构那才叫没啥区别,无非就是buffer更深点儿,计算位宽更宽些。

这些个变化,需要花两年的时间?看起来研发实力堪忧啊!可这是聚集了世界上最顶尖的高智商人才的地方搞出来的东西啊!为什么会有这种巨大的偏差?其实研发人员已经被这个周期卷得苦不堪言,发布一个新架构,有多少软件、硬件、系统验证的工作要做,可是时间只有短短两年,怎么办?只有尽可能的沿用之前的架构,不到万不得已不做大的改动。两年的时间要推出一个全新的架构基本上是mission impossible,可是老大们不这样看:我们伟大的领袖摩尔先生已经预言每18个月晶体管集成数目就会翻一番,现在都给你24个月了,还多出半年,裕量很宽嘛。疯狂内卷的结果就是形式主义至上,创新的火花逐渐熄灭。

于是我们看到不思进取,躺在功劳簿上吃老本的Intel把曾经叱咤风云的钟摆计划玩成了挤牙膏。大概它并没有意识到这个光荣称号代表广大人民群众的忍耐已经接近极限,还高傲的以为不过是发发牢骚,总有一天它会为自己的傲慢买单。商鞅变法固然使秦国称霸一时,但这种不可持续的严刑峻法,也注定了秦朝的短命。

 

1.5 生态环境

大概是过去尝了Wintel联盟的甜头,Intel也很注重生态圈的发展。其实我有时候挺困惑的,这究竟是一家芯片制造公司,还是一家服务供应商?

但是不重要,人家说生态圈会为客户提供一整套的解决方案,除了少数自己有研发能力的集团,可以把剩下一大票人傻钱多的土豪网罗进来,什么移动、电信、石油、化工、医疗、教育……客户多着呢!

不知道为什么,这种发展路线总让我的脑海中浮现出这样的画面:

土豪:我想买一个工具能从鞍山到北京

生态圈:没问题,我们这儿底层有各种资源:马库、驴库、牛库等等;中间层有先进的工具进行资源调度,给您提供最佳的资源配比;上层有华丽的包装,保证您使用时看上去高大奢华上档次。

土豪:这速度有多快啊?我听说马富豪用的是私人飞机

生态圈:那多费钱哪!您知道私人飞机得养多少研发人员,维修人员,保养人员吗?我们这儿多省事儿啊,您只要把钱一交,两眼一闭就上车了,研发维护啥的您都甭操心了

土豪:确实省事儿哈!那你们这业务能给我开通多久啊?

生态圈:您目前不在我们政府的黑名单里面,业务没有时间限制。不过您也别担心,哪怕有一天您进了限制名单,我们也会给您四个月的缓冲时间去做业务转型。

我们当然希望政治远离科学,但在一颗芯片都会被掐脖子的现实下,盲目追随玩生态圈是想彻底放弃治疗,虱子多了不怕咬吗?

另外,如果想做号令天下的武林盟主,就修炼内功,把自己打造成令人信服的老大,别跟左冷禅、岳不群似的,总阴谋算计着去害竞争对手,算来算去,到头来反而把自己整残了。此条建议适用于小至团队成员,上至国家元首。

不知不觉吐槽了那么多,可能有人要说我是黑粉,这个知名老牌名企难道就没有什么做得好的地方可以夸夸吗?当然有,不过从它近些年来的教训中更有值得我们去学习的东西。另一方面,我也确实带有由个人经历引入的认知偏见,所谓距离产生美,站近了拿放大镜看,西施也有雀斑;离远了看,母猪都能赛貂蝉(^_−)☆

 

接下来该轮到赵国和燕国出场了,他们对应的是AMD和Xilinx,敬请期待下回分解。

 

文中所述仅为作者个人观点,真诚的欢迎大家给我提意见,开通此公众号也是为了督促自己不断成长,文中的错误和不妥之处,恳请您予以批评指正。


参考资料:

1. 舍不得看完的中国史:秦并天下

2. 从春秋到战国—论Nervana的倒掉-面包板社区 (eet-china.com)

3. A Peek Inside That Intel Xeon-FPGA Hybrid Chip (nextplatform.com)

4. 深扒苹果、Intel的爱恨情仇:Intel为一个决定悔断肠-Intel,苹果 ——快科技(驱动之家旗下媒体)--科技改变未来 (mydrivers.com)

5. Inside Nehalem: Intel's Future Processor and System (realworldtech.com)

6. Intel's Sandy Bridge Microarchitecture (realworldtech.com)

 

posted @   霁月清空  阅读(43)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示