GPGPU通用图形处理器技术

GPGPU通用图形处理器技术

GPGPU,即通用图形处理器(General-Purpose Graphics Processing Unit),一个从GPU衍生出的概念。如果说GPU是巨头的游戏场,GPGPU就是一块正在快速开发的新市场。

GPU芯片,就是常说的“显卡”,擅长做并行计算;CPU则长于横向计算。两者组成异构计算的一对黄金搭档。

计算领域正初步形成“专用”和“通用”的格局。随着人工智能产业爆炸式增长,导致计算复杂化和算力不足,加上CPU并行计算能力不及GPU,使得GPU的通用性计算优势愈发明显,在一众xPU中脱颖而出,成为算力时代VIP。

为了进一步专注通用计算,GPGPU便应运而生。

GPGPU并不比GPU更厉害,只是去掉GPU的图形显示部分,将其余部分全部投入通用计算,并成为AI加速卡(一种并行计算硬件)的核心。

本文参考文献链接

https://baijiahao.baidu.com/s?id=1722621354697019669&wfr=spider&for=pc

https://mp.weixin.qq.com/s/4M-V7fvv1IzVSQAvjCKwBw

https://36kr.com/p/1688148987876224

[1]https://www.imaginationtech.com/products/gpu/

[2]http://sam.zeloof.xyz/ic-design-tools-from-verilog-to-mask/

[3]https://encyclopedia2.thefreedictionary.com/VHSIC+hardware+description+language

翻开GPU的历史一查,满本都写着两个字是“通用”。

 

 

 GPU在图形领域的可编程性经历着不断演进的过程,直到2006年,英伟达 CUDA(Compute Unified Device Architecture,统一计算设备架构),及对应工业标准的OpenCL的出现,让GPU实现更广泛的通用计算功能,GPGPU的概念才算真正落地。

 

 

 GPU发展历程

在加入天数之前,吕坚平曾在英伟达、英特尔、三星、联发科等众多跨国半导体巨头担任要职,见证了GPU的改变。他坦言,在2000年初在英伟达研发GPU架构之际,团队“头脑风暴”就讨论过“两个图像如何相加”“原有图形上的通用计算如何实现”等问题,彼时就发现GPU可以做很多图形外的计算任务。

后来,英伟达经过多次迭代,发掘了许多图形之外的应用领域,诸如超算、医疗、科学运算等,并获得了不错的回报,并使用GTX/RTX和Tesla两个前缀区分显卡和AI加速卡。

近几年GPU大会显示的趋势是:GPU将会向大规模扩展计算能力的高性能计算(GPGPU)、人工智能计算(AIGPU)、更加逼真的图形展现(光线追踪 Ray Tracing GPU)三大主要方向发展[1]。

GPGPU是GPU未来重要趋势之一,也是国产的一次机会。

入场门槛极高,却诞生了一个奇迹

在显卡这个成熟市场,强势的英伟达、AMD令后来者难以立足,加之支持桌面级显示和游戏渲染的显卡,背后需要很多技术支持和迭代,因此市场由国外巨头长期把控。不过,该领域并非没有“叫板者”,只是门槛过高,强如Intel,也难以如愿。自1998年推出第一款GPU i740、2007年推出Larrabee都相继失败,而当这家巨头重启独立GPU计划时,已是2020年。

通过GPGPU占领市场,成为国产厂商的另一个选项,这是天数选择GPGPU赛道的原因。

实际上,巨头也做GPGPU,只不过,不同之处是:巨头如英伟达和AMD,在定制“数据中心级GPU”(实即GPGPU)时,只是删除了显示接口,留下图形部分;国产后进者在研发GPGPU时,则不仅去掉了GPU的显示功能,还去掉了图形渲染功能。去掉的功能虽多,但由于国产厂商的研发工作从零开始,难度依然与GPU相当。

高算力的GPGPU芯片,底层硬件如同迷宫,设计和生产的要求十分复杂、专业和苛刻。GPGPU芯片上会放很多运算单元,让这些运算单元最适当组合并拥有最高的运算效率实现难度极大,一个部分计算单位效率不佳,对整个芯片的影响将放大上千倍。

芯片量产前还要经历冗长的设计测试流程。通常一款高端芯片前端和后端设计要耗时1~3年,设计完成后流片环节需要3~6个月,期间还会有流片失败一切重来的风险。即使成功流片,还需经过3~12个月的产品测试调优,才能开启量产。

 

 

  最近几年大芯片投资赛道,数GPU热得发烫。一众初创公司涌现,大厂精英抱团创业,巨额融资不断刷新行业纪录。一些成立较早的企业,已经进入研发落地阶段,刚成立不久的厂商,也旋风般推出相关产品。

与GPU创业高热相伴的,是从未间断的质疑声:估值虚高,PPT发布,套壳马甲……一些国内GPU创企推出的产品,被认为已经背离了芯片研发规律,成为融资的工具跳板,后生们不讲武德,坏了规矩。

国产GPU创业领域目前存在哪些问题?应该以什么样的态度发展国产GPU?与海外巨头相比,有何差距与挑战?追赶的机会在哪?集微网同产业人士进行交流,探寻国产GPU创业浪潮风起云涌的背后。仔细丈量国产GPU的“成色”,或许有助于更加清醒地正视现实。

一、乱象丛生 泥沙俱下

近两年,受市场需求以及政策、资本的推动,GPU在国内受到疯狂追捧。地缘政治、大国博弈背景下,相较于已有一定积累的国产CPU,国产GPU的破局更具紧迫性和必要性。人才储备程度,科创板提供的退出机制,也为国产GPU的发展创造了良好契机。

于是,GPU成为继AI之后,最为性感的芯片投资赛道。资本的蜂拥而至吸引了来自英伟达、AMD、海思、高通等一众大厂精英创业。据不完全统计,目前该领域的初创企业已近20家,所有一线投资机构均参与其中。

谈及目前国内GPU创业领域的现状,行业人赛道过热且拥挤,市场鱼目混珠、泥沙俱下。

一些企业推出的产品,不管是在跑分还是在标准测试和应用方面都取得了进步,但也有不少产品和演示目前还处于“PPT”状态。对于那些成立一年左右就推出多款产品的公司,颠覆了行业认知。

一块GPU芯片的研发周期从立项到上市至少要3~5年,好的芯片要经过架构和应用打磨,这个过程也不可能低于两年。有的产品宣称是自主设计,但明显违反整个芯片的设计规律。GPU不可能一年半载就设计出来并跑通应用,有可能设计全是外包,或是将已流片的设计的Spec配置稍作修改。

一些GPU新势力尚没有明确细分市场,也没有想清楚未来长远的发展方向,只会用PPT吹牛,发布产品参数和性能对比时混淆视听,实际并不能够正常量产或进行流畅演示,真实性和可靠性大打问号。

有的芯片参数比较奇怪,宣称算力是6T Flops/s,存储能力是50GB/s,两者的比例达到120:1,但实际上GPU最理想的比例应该是25:1,这在应用层面非常尴尬,不知所用何处。此外,有的芯片带宽非常低,无论是用于AI计算还是图形,基本上都发挥不出功能。

行业看来,这样导致的结果是搅乱了市场,浮躁了人心,在GPU这样一个高门槛且重积累的领域,不讲诚信,违背市场、技术规律,待潮水退去后,只能是一地鸡毛。

二、资本裹挟蒙眼狂奔

GPU创企在产品上的乱象丛生,有些是迫不得已。

海思做GPU,前后花了4年半,在华为强大流程体系支持下尚且如此,初创企业难度更大。如果也做这么长时间才出产品,投资人不会答应。

有的GPU初创公司与投资方签下对赌协议,在某个时间点推出芯片产品,是决定拿到下一轮融资的入场券。

资本裹挟之下,一些配置错误、不合逻辑、完全不像正常产品的GPU芯片横空出世,冠以自研、国产、打破垄断之名。吃瓜群众亢奋,行业人士错愕。

很多国内GPU的研发,已经脱离了芯片开发的初衷,所有的成果展示和发布,其实是以融资为目的。

赛道的火热以及大规模的融资助推GPU初创企业估值一路走高。一些成立一两年的热门企业,估值已经达到两三百亿元,GPU成为高估值代名词。

不少业内人士呼吁,对于那些通过“放卫星”博眼球的方式来吸引关注的可疑产品公司,需要投资人和相关的市场机构进行甄别以及理性对待和评估。

北科建集团产业运营负责人李锴表示,国内GPU从整体而言,受到了政策推动的影响,有了积极进展,尤其包括“东数西算”政策、算力芯片和智慧化应用的市场打开。但目前阶段的投融资热度,还是一种行业聚焦惯性投资,依靠当前的政策性红利,大部分投资标的还属于高风险投资项目。

真正投进去,一是要考虑估值是不是虚高的问题,二是需要专业性的知识背景和能力,考验投资机构慧眼识珠的本领。

但独具慧眼似乎是少数,GPU赛道的玩家更多处于“蒙眼狂奔”中,几年过去,投资热度仍未消减。

不否认GPU赛道过热,但不认为GPU创企估值过高,因为GPU的价值摆在那。

如果真的中美脱钩,高性能GPU被卡脖子,中国一定要想办法替代。一个GPU工程师年薪50万,2000人的企业,人力一年就要10亿,每年二三十亿的整体开支跑不掉。投资方愿意投钱给不同的创业团队也有道理,谁都想赌一把中国的AMD和英伟达。

三、图形/计算 花开两朵

GPGPU、通用GPU、全功能GPU、图形GPU、渲染GPU、GPU+……在国内,GPU命名上的文字游戏已被厂商们玩坏,也让外界对这些产品一时云里雾里。

按功能划分,GPU主要分为侧重图形图像的渲染GPU和侧重通用计算的GPGPU。

目前国内初创GPU公司,结合优势和阶段性定位,分别采取了不同的切入路线。其中GPGPU公司包括壁仞、沐曦、登临、天数智芯、红山微电子、珠海芯动力等,渲染GPU企业包括摩尔线程、励算、深流微、瀚博、芯瞳、格兰菲等。

 

 

 GPGPU相当于大算力芯片,是传统计算的回归,GPGPU的创新等同于将一些专用加速功能变成GPU的一组指令集,芯片面积只有原来的1%-10%,却相当于实现了一个全新专有芯片的加持,同时具备通用计算的性能,这使得边际成本更低,更具价值。

渲染GPU约80%仍是GPGPU部分,20%则是固定渲染流水线(fixed function),例如geometry pipeline、rasterization pipeline等。固定渲染流水线涉及较多的数学公式,因此比较依靠编译器和驱动等软件能力,GPGPU在硬件和应用层面较为复杂。

从软硬件复杂度看,渲染GPU复杂度更高。从开发人员团队数量来看,GPGPU如需要200人的硬件团队,渲染GPU可能要再增加50人,但软件开发人员相比GPGPU或需增加三倍,需要更多的人员开发驱动和编译器等。

芯动科技首席SoC架构师认为,图形渲染GPU因为经过了十几年的演化进程,流水线长,实现起来复杂,设计上的挑战更大,同时存在很多专利陷阱。

芯动科技目前聚焦于渲染GPU领域,但GPGPU也在规划之中,芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然GPGPU的价值很高,增长也不错,但图形渲染GPU在细分市场总的体量更大。

对于一家初创公司的首颗GPU产品来说,如果要同时自研渲染GPU的固定渲染流水线IP、统一着色器(shader)IP,需要的时间和人力成本将非初始的几百人团队可以承受。因此,沐曦采取先做GPGPU,再发展图形渲染GPU的模式。在自研GPGPU中,只有统一着色器IP,不需要固定渲染流水线,这样可以在自研GPU的道路上一步一个脚印稳健前行。

四、核心IP 十年差距

任何一款高端芯片的打造,都离不开基石——IP的“成全”,IP的质量很大程度上决定了国产GPU性能的底色。

在步日欣看来,GPU作为高性能的大芯片,在短期内出成果,必然需要依赖外部IP。国产GPU厂商能够快速推出相关产品,很大程度上依靠外购IP。

但打着自主研发之名,行外购之实,推出“马甲”产品就难免有忽悠之嫌,这样的案例在芯片领域本就不在少数。

自研IP越多,芯片设计上越有把握,产品的差异化更明显。但相对而言,资金、人员、时间上的成本投入也更高。王强告诉记者,GPU IP自研需要36-48个月以及200个工程师,采用外购IP的方式,可以减少12-18个月开发周期。

考虑到GPU的研发非常考验项目的目标管理能力,对于团队能力和组织工程能力要求很高,初创企业由于能力有限,短期内如果自研路线不顺利,会选择大量外购IP或“马甲”路线。但从长远看,公司团队的成长、市场定位以及盈亏平衡不能得到保证,会逐渐拉开跟行业领先公司的差距。

据集微网了解,GPU 的IP主要涉及三大类,一是模拟IP,包括PCIe、Displayport和HDMI等等,这方面国内厂商占有率较低;二是Memory;三是数字IP,包括基于Arm或RISC-V的微控制器IP、编解码芯片IP以及最核心的GPU IP等。核心IP国内有Imagination、芯原、格兰菲等厂商,相对而言,Imagination认可度较高,芯原是后起之秀,格兰菲主要面向特定领域用户。

国内核心IP能力至少比英伟达、AMD等落后十年左右。整体而言,GPGPU企业与国际大厂技术差距约3年,渲染GPU与国际大厂差距约10年左右。

李锴认为,国内GPU底层技术空白点较多,IP大多受制于国外厂商,产品前端稳定性不理想,目前又很难在主线中高端电子产品上得到普及化应用,需多年沉淀形成自主IP积累才能具有一定替代性。

外购IP并不意味着无法自主可控,但对GPU企业的能力要求很高。

芯动科技与Imagination的合作是与苹果一样的架构授权,基于该初始架构芯动科技探索了很多方案,包括自研的Cache一致性Innolink Chiplet技术,内置国产物理不可克隆iUnique Security PUF信息安全加密技术等。

芯动科技去年推出的渲染GPU‘风华1号’80%以上的IP都属于自主研发。既然已经获得了架构授权,芯动科技就可以不受限制地自行改进,能够做到自主可控。

五、生态之路 道阻且长

除了硬件性能上的比拼,高性能芯片的生态搭建也是绕不过去的一道坎儿。某种程度上,生态比硬件更重要。

在最终量产和商业化产品出来之前,国产GPU还没到谈论生态和应用层面的地步,GPU生态是除产品外初创企业能否活下来的重要因素,是一开始就要考虑的问题。

对于渲染GPU和GPGPU,构建生态的难度截然不同。

渲染GPU在技术层面来相对复杂,但是好处在于有很多业界成熟的标准的API,如OpenGL、OpenGL ES、DirectX、Vulkan等。只要打通了整个驱动程序层和编译器生态,就基本完成90%。

在GPGPU领域,几乎是被英伟达一手打造的CUDA生态所垄断。

GPGPU的生态非常复杂,要求一路打通到应用层,提供面向所有应用的全面支持,甚至要自主开发以支持一个新的应用领域。

虽然不少GPU初创公司推出的产品都号称兼容CUDA生态,但存在兼容多少的问题,水分较大,比较重要的特性中可能60%-70%都无法支持。

 

 

 兼容CUDA并非易事,需要投入工程师的数量巨大。涉及50个驱动、50个编译器、50个数学库、300个应用层工程师,3-5年的时间。功能的验证,用户的培养需要额外3-5年,每年还要至少开支1000万-3000万元资助外部开发者。

使用的人越多,生态越占统治地位,看看国内的初创GPU企业,哪些是已经开始编写教材、在高校开课和开展合作项目、组织比赛等做这些人才培养方面的工作,就知道谁真正在沉下心来做生态了。

国产GPU业应采取开放合作的心态,学会站在巨人的肩膀上,善于利用现有架构和生态,设计契合市场需求的优秀产品,打造全球化设计水平的开发团队。国产GPU在起步阶段兼容现有生态更容易发展,先求生存;长期还是要摆脱兼容思路,站稳脚跟后再求发展自有的核心技术。

在GPU生态中,软件的权重已越来越高。Imagination中国区战略市场与生态副总裁时昕博士提及,GPU软件极为复杂,包括各种图形API和计算接口、基础库、与上层应用对接适配等等,开发工作量巨大。

从应用角度来看,国内GPU生态的发展更需要“众人拾柴”。要加快打造国产GPU产业链,下游的整机厂商需要对国产GPU给予更多包容。

国产GPU可能99%已达标了,如果能帮助国产GPU厂商一起将这百分之一影响体验的最后一步补齐,做到更完善,这对其发展是非常重要的。

六、掘金市场 盈利维艰

对于GPU创企而言,巨大的研发费用和资本开支是必需,但长期、持续的利润支撑才是GPU跨代发展的强劲驱动力。GPU的成功和成熟需要大量的验证和出货,这就需要国产GPU厂商瞄准目标应用市场发力。

对于初创企业而言,渲染GPU涉及到生态建设的完善度,所以从信创、军工、工业等领域切入较为稳妥。GPGPU市场从人工智能、服务器、高性能计算等领域切入是最优选择。

但初创GPU企业掘金市场的现实却相对骨感。

比如,在渲染GPU的传统应用如视频、游戏等领域,英伟达和AMD构建的护城河可谓固若金汤,国内企业与之差距较大,这一市场全球容纳三四家都比较困难。

短期看,虽然国内信创市场提供了一定空间,但总量不大,且偏向于中低端。因此,如何分食这一“蛋糕”之下还能实现正循环,是国内渲染GPU厂商面临的问题。从中长期看,虽然云端渲染成为新的增长点,但元宇宙、云游戏、云手机等市场普遍认为将在2024年前后起势,因此当下如何获得盈利求生存也是艰难挑战。

在GPGPU方面,比如在AI计算领域,面临场景应用复杂且碎片化,以及国内众多竞争对手混战的局面。

游戏、3A大作对GPU的图形和计算相对要求比较全面,国内企业在Windows领域追赶难度较大,但在安卓手游、信创桌面和某些定制的服务器领域,以及自动驾驶领域,国内厂商有机会实现切入。目前,芯动科技的风华系列GPU瞄准国产信创桌面和服务器这两大细分领域。相较于信创市场,服务器显卡单价更高,实现盈利较有希望。

除生态之外,当下对于初创GPGPU企业生存而言,最大挑战是产能。

目前和AI相关的大芯片,因为需要Cowos等先进封装,所涉及的中介层原材料非常紧缺,在目前产能吃紧的情况下,对于已经推出一些产品的初创GPU企业,会面临短期盈利的问题。

七、弯道超车 路在何方

中国在高端GPU领域缺席多年,面对海外巨头固若金汤的专利、生态等壁垒,GPU业从战略布局成长为核心支柱,显然还有漫长征途。

国内GPU企业发展破局的关键在于找准定位,贴近市场。

国内的渲染GPU厂商应该着重于贴近市场的定位和创新,使得设计和能效能够贴近应用,力争在专有应用领域或局部领域实现突破,然后再进一步拓展和打磨经验和能力,使得最终在生态和应用上能跟技术创新良好结合,形成正向循环。

跟国外巨头相比,国产GPU在一些专用领域优化方面,并不是完全亦步亦趋。通过在这些领域发力,能够在计算密度或在工艺、节奏、带宽密度等面体现出差异化,可以使产品在性价比,在某些特种应用方面能够达到国外GPU的能效,甚至做得更好。

在GPGPU方面,英伟达没有百分百的优势,国内GPGPU在某些方面可以说是超越的。国内厂商在HPC和服务器、通用计算等领域可以依托Linux的开放性和可控性强的优势,实现有效突破。

在杨建看来,国内GPU厂商的最大优势在于本土支持。

如果整个市场是一个地图,国内GPU厂商可先撒点,针对一些特定市场循序渐进抢占生态,加强与国内厂商的紧密合作,积累一定的优势和声誉后,再由点及面布局寻求突破。

多位受访者提及,高端芯片研发周期长、投入大,没有足量资金支持无法取得成功,但过度的投资热潮容易滋生投机现象,互联网投资的模式并不适用于芯片领域,国产GPU要谨防重蹈AI芯片的覆辙,需要正视差距,脚踏实地前行。

烧钱的模式是难以为继的,只有踏踏实实服务客户,服务市场,并且能够不断的回收研发成本,进一步实现创新,才是国产GPU的成功之路。急功近利,疯狂招人,疯狂烧钱的模式,实际上不可能快速弥补国产GPU跟国外GPU之间的差距,因为国外的GPU是一个个应用打磨出来的,国产GPU一定要有耐心,才能够在这个领域实现创新和弯道超车。

国内GPU距离国际大厂还有很长的距离,特别是目前的竞争格局下,国内GPU还处于野蛮生长阶段,虽然资本市场较为关注,但同质化竞争和创业造成了很大的人才和资金的浪费,一定程度上制约了国产GPU的发展进程。

下一步这几十家GPU企业,肯定要面临一定程度洗牌,那个时候才是真正的国产替代、缩小差距的开始。

国产GPU为何“一夜杀到老黄城下”?

国产GPU,这波发展势头有点猛啊。

先是芯动科技在去年底推出一颗“风华1号”,剑指高性能桌面级/服务器级显卡市场。

现在摩尔线程仅用18个月时间,量产上市了一款全功能国产GPU。壁仞科技也紧跟着宣布首款通用GPU芯片点亮成功。

如此速度成果,甚至引来外界惊叹:

这是一夕之间就杀到了老黄城墙下的节奏?

大家最关心的,一是产品本身,性能、价格、啥时能买到。

再就是背后的行业突然火爆的原因,“怎么就做到了?”、“专利咋就饶过了?”

热议之中,“IP授权”一词也逐渐浮出水面。

比如,在这轮讨论中被反复提及的,就有一家名为Imagination的芯片设计厂商。

坊间传闻,这一波GPU头部创企的新产品起势,有不少与其脱不开关系。

中资背景的芯片设计公司

Imagination Technologies,和大名鼎鼎的ARM一样,这是一家总部位于英国的芯片设计公司,依靠向其他厂商授权芯片IP,收取授权费盈利。

早年间,这家公司曾以“苹果御用IP授权商”而闻名。

从第一代iPhone到iPhone 7 Plus,A系列芯片中的图形处理器部分,都是基于Imagination的PowerVR的IP核设计开发。

事实上,不仅是苹果,英特尔、三星、联发科、华为海思等都是Imagination的客户。

统计数据显示,在2010年,全球售出了超过2.15亿枚包含PowerVR技术的芯片。

2012年,Imagination在移动GPU IP授权市场占比接近50%

另外,据《金融时报》报道,英特尔和苹果都曾大量持有这家芯片设计公司的股份,以至于该公司一度陷于两强之间拉锯战。

2016年,还有媒体报道苹果已经与Imagination就收购进行了“高级谈判”。但最终这项收购案并没有下文。

 

 

 一个重大的转折发生在2017年。

2017年4月,苹果官宣与Imagination“分手”,开始自研GPU。

这使得Imagination的股价应声暴跌,跌幅一度超过70%——据《金融时报》报道,在当时,Imagination有一半以上的收入来自苹果。

在此之前,Imagination的GPU业务本就已遭受来自ARM Mali的冲击。

ARM为了拓展Mali GPU的市场份额,采取了“买CPU,送GPU”的策略,即购买CPU核授权,就能享GPU核折扣。

不少媒体评价认为,虽然Imagination在移动GPU技术上具有领先优势,但ARM的“买一送一”策略还是让不少手机芯片厂商选择调转阵营。

困境之下,最终是一家中资背景的私募基金抬了Imagination一手:主要资金来自国新基金的Canyon Bridge出资5.5亿英镑(约合49亿元人民币)收购了Imagination Technologies。

值得一提的是,Imagination还曾将CPU芯片架构MIPS收入囊中,但在牵手Canyon Bridge时对该业务进行了拆分出售。

虽然如今的移动GPU一号位已经被ARM抢占,但Imagination近几年的发展势头又起来了。

尤其是其在移动光追技术上的投入,现在已经初见成效。

虽然除了芯动科技以外,官方没有明确透露有哪些国产芯片厂商与Imagination达成了合作,但完美世界、腾讯游戏、网易游戏等游戏公司都出面为PowerVR Photon这个“移动GPU领域最先进光追架构”站过台。

苹果也已在2020年1月与Imagination重修旧好,达成了新的多年期授权协议。

IP授权是怎么个玩法

说了这么多,像Imagination这样的IP供应商,到底在GPU设计开发的过程中扮演怎样的角色?

首先要解释的是,芯片领域说的IP就是知识产权的那个IP(Intellectual Property)。

已验证的、可以重复使用的集成电路设计模块又称作IP

在早期,芯片公司会把开发好的、能完成特定功能的电路做成模块复用,也就是常说的不要重复造轮子”

随着集成电路规模越来越大,芯片功能越来越复杂,各类电子产品上市节奏也在加快。

一家芯片公司很难再独立完成所有模块的设计,使用已验证的成熟IP核就成了降低成本、缩短设计周期的必然选择和行业惯例。

专门提供IP核授权的供应商也从产业链中分化出来。

这方面最大的公司就是ARM,像高通和联发科等手机芯片CPU部分用的ARM Cortex-A710和X2等,就是以IP核形式授权的微架构。

 

 

 根据授权形式,IP核又分软核、固核和硬核三种。

软核是用Verilog/VHDL等硬件描述语言描述的电路模块,只提供源代码不涉及硬件部分。

 

 

 固核是在软核基础上完成了门电路层面的设计和验证,交付的是门级电路网表(Gate-level Netlist)。

 

 

 硬核进一步完成了物理上的布局布线、包括仿真验证等步骤,提供设计阶段的最终产品掩膜版图

 

 

 从软到硬,购买IP核后需要完成的工序越少,可调整空间也越小。

不过,即使可以从第三方购买IP核,完整的GPU设计仍然不是一件容易的事。

以英伟达最新发布的Hopper为例,一个全功能GPU架构,光是运算部分就包括用于图像渲染的流处理器、用于数据计算的张量单元、再加上光栅化处理单元(ROPs)、光线追踪单元等。

周边还有显存、缓存、视频解码、电源管理、PCIe总线接口等。

 

 

 △ Nvidia Hopper架构

根据IBS统计,7nm制程下单颗芯片中可集成的IP核数量平均为178个,到5nm还会增长到218个。

要把这么多IP核集成到一起,保证高效协作依旧困难重重。

对于软IP需要做硬化、不同IP之间接口的统一、还有芯片整体的布局设计、整体验证和测试等……

有任何一点疏忽都可能造成流片失败,需要从头再来,上亿的流片费用和前期更多投入都血本无归。

GPU IP核授权市场上,ARM、Imagination、芯原微电子目前占有率排全球前三。

三家的风格和境遇也不尽相同。

ARM的Mali系列GPU主打移动端,被联发科、三星、华为海思选用。不过海思前景不明,三星也开始着手在AMD架构授权下自研IP。

Imagination更专注于GPUPowerVR早年性能领先于高通和ARM,但收入来源单一,失去大客户苹果后遭重大打击,正在寻求开拓桌面、车载和高性能计算市场。

芯原微电子(VeriSilicon)是国内老牌IP供应商,同时提供一站式芯片设计服务,GPU业务收购自美国图芯(Vivante)。现在是国内排名第1、全球排名第7的芯片IP授权服务商。

 

 

 △图源:芯原2021年报

国产GPU最近一段时间借助IP授权多点开花,纷纷流片成功或量产,算是迈出了艰难的第一步。

IP授权模式除了能减少投入加速回报,还能迅速积累经验、逐步建立起人才队伍。

有了积累之后,才可能像苹果、三星一样攀登架构授权+IP自研之路。

事实上,就连苹果的自研IP也并非一帆风顺,分手3年后又回头重新与Imagination合作,据市场传闻有专利方面的原因。

IP核供应商早已用技术优势与专利权构筑起护城河,芯片设计公司想绕过就要付出更大的代价。

如手机GPU搭载光线追踪成为一大趋势,Imagination与高通走在前面,苹果如坚持自研,就要绕过已有专利提出新方法,如此则面临跟不上产品更新换代节奏的风险。

最后,一款GPU能否成功走入市场也不光是硬件的事,配套的编程接口和软件支持也很重要。

像英伟达能成为GPU市场上的霸主,除了硬件性能强大,CUDA计算平台生态也是一大原因。

AMD对应推出的ROCm开放计算平台,短时间内也难以撼动CUDA的统治地位。

像摩尔线程、壁仞科技这样的国产GPU创业公司,还有很长的路要走。

国产GPU,为何是现在?

国产芯片创业上一轮爆发与AI热潮同步,聚焦于数据计算,也就是各类DPU、NPU。

15年开始,诞生了地平线寒武纪、燧原这一批AI芯片独角兽,随后BAT华为等大厂也纷纷亲自下场。

20年下半年开始,资本市场上讲出了包括图形渲染在内的全功能GPU的新故事。

壁仞科技、摩尔线程先后成立并大笔融资,芯动科技、兆芯等老牌芯片公司的独立显卡项目也在这附近官宣。

这段时间几件大事,或许都有影响在其中。

首先要说的是,2020年国家全面推广信创产业,其中涉及芯片、服务器的国产替代、自主可控。

芯动科技就把“信创”列为风华1号的主要应用方向之一,还与国产操作系统统信达成生态合作,完成国产GPU与国产OS的适配。

 

 

 △芯动科技官网

另外,受全球芯片短缺和挖矿影响,GPU本身的价格也从2020年开始暴涨。

GPU挖矿主要挖的是以太坊,其价格在一年间增长了4.8倍。而在这之前,芯动科技的业务之一是生产挖比特币用的ASIC矿机。

 

 

 △芯动科技官网

最后,元宇宙、数字人、AR/VR的火爆也把3D图形计算需求抬到新高度。

壁仞科技在应用方向上透露过重点关注自动驾驶和元宇宙、摩尔线程还特别提出“元计算”。

如此看来,2020年中段开始创业或立项,不到2年纷纷拿出量产或流片的成果,就是国产GPU现在的速度。

其中芯动科技的风华1号明确表示使用了Imagination的IMG B系列GPU IP,另外几家没有透露具体情况。

PS. 针对Imagination IP授权一事,我们问了问相关头部创企,对方未作回应。

参考链接

https://baijiahao.baidu.com/s?id=1722621354697019669&wfr=spider&for=pc

https://mp.weixin.qq.com/s/4M-V7fvv1IzVSQAvjCKwBw

https://36kr.com/p/1688148987876224

[1]https://www.imaginationtech.com/products/gpu/

[2]http://sam.zeloof.xyz/ic-design-tools-from-verilog-to-mask/

[3]https://encyclopedia2.thefreedictionary.com/VHSIC+hardware+description+language

 

 

posted @   吴建明wujianming  阅读(2051)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2021-04-20 Non-Maximum Suppression,NMS非极大值抑制
2021-04-20 华为计算平台MDC810发布量产
2021-04-20 华为4D成像雷达、智能驾驶平台MDC 810
2020-04-20 CPU消耗,跟踪定位理论与实践
2020-04-20 CMOS图像传感器理解
2020-04-20 水下导航技术
点击右上角即可分享
微信分享提示