Imagination GPU技术与市场

Imagination GPU技术与市场

Imagination 发布新一代GPU,全面解读光追技术在移动端、Chiplet/异构计算在汽车领域的应用趋势

近日,Imagination隆重推出其新一代GPU IP产品IMG DXT。据介绍,DXT高配包括DXT72-2304 RT3,50%的性能增加和计算能力增加,标配达到2.25T浮点运算能力,72GB像素填充能力,9TB的AI推理能力,同时把D4光线追踪技术进行可配置化、可扩展化,黄金搭档搭配光线追踪一起使用。02:

DXT的三大关键技术

DXT产品主要是面向手机游戏。从ABI 2022年的调查显示,手机游戏用户会将会从2022年的26亿增长到2030年的39亿。此外,到2026年,85%的游戏玩家将首选在手机上玩游戏。Imagination认为,手机游戏有三个趋势是非常值得重点关注的:

  • 越来越沉浸感的体验。
  • 更高的性能,更流畅的体验。
  • 低功耗,一直充电或者功耗比较大,这些对手机的玩家也是不可以接受的。

DXT产品的关键技术包括可扩展的光线追踪技术、可变速的着色技术,以及在手机游戏领域可以提高性能、降低功耗的关键技术。Imagination首席营销官David Harold表示:“随着移动游戏市场的不断增长,我们需要平衡该市场对低功耗的要求和对逼真沉浸式画面的渴望。作为高效移动光追领域的领导者,我们正在加快光追的采用并推动整个生态的发展。”

让光追变得触手可及

最近一到两年,光线追踪的热度很高。光线追踪解决的是让3D游戏场景中的光照更加贴近真实生活中的折射和反射。Imagination 中国区技术总监艾克介绍说:“IMG DXT可以使移动设备制造商能够根据自己的设计目标将光追技术集成到他们的系统级芯片(SoC)中。DXT的Photon架构是目前唯一达到光追系统(RTLS)4级的光追设计,这意味着它能够以业内效率最高的方式提供领先的视觉效果。“

Imagination在光线追踪领域有超过十年的技术积累和开发。根据技术特点的不同,Imagination提出了用于区分光线追踪等级技术的RTLS系统。

  • 第一级的光线追踪技术都是软件实现的,开销比较大,CPU占用资源比较高。
  • 第二级的光线追踪技术对一些光和或者三角形碰撞用硬件处理,其实就节省了CPU资源,目前典型的桌面显卡都是这项技术。
  • 第三级的光线追踪技术对BVH回溯就有硬件支持,这是光线追踪描述大场景下的结构,就是大小矩形框把整个场景描述,光线在这里碰撞需要回溯,放在硬件来做的时候能耗功耗比就下来了。
  • 第四级的光线追踪技术有别于前面,除了光和自动测试和回溯,还能把相同光线上的光数统一计算,可以用统一的指令运行。
  • 第五级的光线追踪技术是Imagination的储备技术。

以前的光线追踪技术很多都是应用在PC和主机上。这样的设备,本身的带宽和能耗的要求是可以得到满足的。但移动端就不行,因为移动端的能耗和运算带宽本身受到的限制比较大,所以要尽可能地把这些光线追踪的能力都部署到硬件级别,才能更好地在移动端解决光线追踪的问题。2021年,Imagination发布光线追踪技术,把这项技术引入手机领域,让手机也能用上光线追踪技术,当年也因此获得最佳IP设计奖。

艾克分享说:“DXT提供的是第四级别。与相同移动配置下的CXT相比,DXT能够将提供可用光追的面积成本降低40%。开创性的光追GPU将为所有移动设备用户带来最先进的图形技术。”

 

 

 

 

 Vulkan®的片段着色率(FSR)技术

IMG DXT支持Vulkan的片段着色率(FSR)技术,为开发者带来了性能上的裕量。FSR在尽可能不影响视觉质量的前提下减少处理的片段数量并大幅提高图形性能,同时通过减少投射到场景中的光线提高光追的效率,这意味着可以在更小的硅片面积上实现逼真的灯光和阴影。

FSR是一种可以在几乎不降低图像质量的前提下减少片段着色器运行次数的技术,能够降低占用的带宽与功耗。开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,从而使工作负载减少近94%,实现同等的功耗和带宽节省。所解放的性能使开发者能够利用硬件来完成更多的内容渲染,为玩家打造更高质量的游戏体验。

全新三重通用着色器集群USC

IMG DXT GPU搭载全新的着色器处理单元(SPU)。SPU是一个硅片,包含一个用于计算任务的算术逻辑单元(ALU)和一个用于像素着色、几何处理和光栅化逻辑的纹理处理单元(TPU)。

凭借全新三重通用着色器集群(USC)设计(3个ALU/TPU单元),DXT GPU将每个SPU的高端计算和纹理(ALU/TPU)性能提升50%以上,而以前的架构只侧重于双USC设计(2个ALU/TPU单元)。这个改进后的模块使Imagination能够创造出最高性能的高端移动GPU--DXT-72-2304,这款GPU在1GHz时钟频率下具有72GTexels/s和2.5TFLOP FP32性能。

█ IP的技术趋势

Imagination是世界第四大硅IP,就是硅知识产权的提供商。芯片设计通常由自主设计部分与外购IP组合而成。半导体IP行业处于整个产业链最上游,可为芯片设计提供预先设计、经过重复验证的、可重复使用的功能模块。当前,IP在芯片设计中的占比有提高的趋势。

Imagination 公司副总裁兼中国区总经理刘国军分享说:“当前,半导体开发的成本在不断快速攀升。SoC或者芯片的设计者和提供商对第三方IP的需求将会迎来爆发式增长。”

随着摩尔定律接近极限,IP的发展也出现了两个尤为关键的趋势。异构变得很重要,Chiplet也变得很重要。刘国军介绍:“我们的IP,其实过去几年就在考虑和Chiplet合作,异构计算就更不用讲了。我们的GPU、CPU和AI都是为支持异构计算来做的!”

Chiplet和异构集成

Chiplet,小芯片,又称为模块芯片,是系统级芯片(SoC)集成发展到后摩尔时代后,持续提高集成度和芯片算力的重要途径。它创新了芯片封装理念,把原本一体的SoC分解为多个芯粒,分开制备出这些芯粒后,再将它们互联封装在一起,形成完整的复杂功能芯片。Chiplet最大的优势是降低成本和提升芯片集成度,且有利于后续产品迭代,加速产品上市周期。

日前,阿里达摩院发布的2023十大科技趋势提到,面向后摩尔时代,Chiplet可能将是突破现有困境最现实的技术路径。Chiplet可以降低对先进工艺制程的依赖,实现与先进工艺相接近的性能,成为半导体产业发展重点。从成本、良率平衡的角度出发,2D、2.5D和3D封装会长期并存;同构和异构的多芯粒封装会长期并存;不同的先进封装和工艺会被混合使用。Chiplet有望重构芯片研发流程,从制造到封测,从EDA到设计,全方位影响芯片产业格局。

在显著的技术方案优势下,Chiplet也早已引来多家巨头竞相布局。进入2013年,更是多家企业相继发布其Chiplet产品。1月6日,在2023年美国消费电子展(CES)上,AMD发布了首款数据中心/HPC级的APU“Instinct MI300”,这款APU采用的就是Chiplet(芯粒)技术,在4块6nm芯片上,堆叠了9块5nm的计算芯片,以及8颗共128GB的HBM3显存芯片。1月11日,英特尔在北京发布了代号为“Sapphire Rapids”的第四代英特尔至强可扩展处理器,该GPU的一大亮点之一便是,它是英特尔首款基于Chiplet(芯粒技术)设计的处理器,扩展了多种加速器引擎,被英特尔称为“算力神器”。

Imagination作为IP领域的领先企业,对Chiple的关注和战略部署又是什么呢?为此,EETOP特别采访了Imagination首席营销官David Harold和Imagination技术产品管理高级总监Stephen Barton。

EETOP:您如何看待Chiplet对IP企业发展的影响?当前,Chiplet面临的最大挑战,您认为是什么?

David Harold:作为一家IP公司,Chiplet对我们来说肯定是非常值得关注的一个领域,它意味着我们可以把原有的IP进行重复使用。Chiplet应用本身在制造、使用和设计都会更加方便展开这些异构的计算,很多产品做成Chiplet以后可以在装配前进行提前测试,避免了在装配完成后才发现测试失败,没有办法通过。在这种情况下,失败的是单一的Chiplet,不会影响到整个设备和Device。尤其对很多小的、初创型芯片企业,如果需要做SoC的话,那Chiplet将是一个比较好的切入点和新的切入方向。

当前,Chiplet的最大挑战就是接口过于碎片化,但这样的挑战比起Chiplet的发展给大家带来的益处而言,未来效果肯定会更好,所以值得大家克服这样的挑战。

EETOP:Imagination在Chiplet领域的推进计划是怎样的?您如何看待像英特尔、ADM这样的大半导体公司在Chiplet领域的发展?如果Imagination开发Chiplet的产品,着力点会放在哪?竞争优势又是什么?

Stephen Barton:我们当初设计B系列GPU就已经专门针对Chiplet做了相应的设计,能够更好地适应未来在Chiplet中的应用。这样的设计理念和思路也将会延续下去,包括现在的D系列以及以后新的GPU里面。

David Harold:其实Chiplet是介于IP和芯片组之间存在的形式,英特尔这样的大型半导体公司就更像是可以利用Chiplet把内部原有的IP技术变得像我们一样进行IP化,就是把X86往ARM或者RISC5的方向发展,大的半导体公司也会利用这样的机会拓宽外部的IP市场,一定程度上变得像一家IP公司一样,通过这样的方式运营。

很多异构架构把CPU、GPU、AI和以太网结合到一个Chiplet,这确实可以带来很多未来先进的应用场景,也有很多机会,会在某些特定的市场上大放异彩。手机上一直推行采用最新的工艺节点和SoC,可能Chiplet不会那么快地展开手机场景中的应用,但其它应用场景比如汽车或者消费电子,Chiplet都是大有可为,我们自己也非常感兴趣。

再加上另外一个趋势,就是异构计算。我们公司对RISC-V一直都是很有信心的。它一定会带来颠覆性的、巨大的变化,改变很多的东西,只不过这个过程会是需要时间的,可能是十年以后。我们希望GPU IP可以成为诸多RISC-V架构的首选,现在有很多RISC-V相关的IP Vendor,但能提供GPU IP的并不多,我们希望进一步巩固这种领导地位。

EETOP:谈到汽车行业,这是大家都非常关注、也是未来非常重要的一个市场。在汽车领域,SoC有一个趋势,就是把CPU和GPU集成在一块,这个方向是不是未来的技术趋势?除了这个趋势以外,SOC目前还有哪些值得关注的方向?Imagination2023年在汽车领域有没有什么汽车创新和技术部署的规划?

David Harold:目前对车辆相关的解决方案有多种不同的设计形式,其中包括异构计算,也有把CPU和GPU捆绑整合在一起,放在车辆上的同一位置或者以传统的方式分开,放在不同的离散连接方式,通过离散的方式连接起来放在车内不同的位置。现在还不能确定哪种趋势就已经成为技术路线上的一种主流。我们是比较偏向于异构计算,毕竟我们自己在AI、GPU和CPU方面的能力都很强,也有很强的能力合理地在这些不同的芯片中分配合理的工作量。针对这些车辆上的应用有一个关键点,不管采用何种方式进行架构的部署,最重要的一点就是所有设备都要符合车规级的要求,达到ISO26262的标准,ISOD和ISOB。

目前Imagination已经有很多IP应用在数以万计的车辆,也有相应的其它技术储备,HMI、ADAS高级驾驶辅助系统,车辆使用的CPU、GPU和这些设备中的连接方式等,而且都是能够符合车辆功能安全级别。车辆专属的设计在我看来是比其它的整不整合更加重要的事情,我们现在已经有了专门为车辆应用去做设计的能力、团队以及心态,这才是目前最重要的一点。

补充一点,汽车行业真的已经开始越来越多地应用RISC-V架构的CPU,我们第一家RISC-V的客户就是车企,现在有越来越多的企业尝试嵌入式的RISC-V,如Google定义未来各种设备都会采用RISC-V,包括移动端,我们认为最先到来的使用RISC-V,大规模的使用场景一定会是汽车行业。

Imagination是世界第四大硅IP,就是硅知识产权的提供商。Imagination有近三十年的技术积累,是以GPU立足行业,核心技术有着非常大的优势。

刘国军分享说:“过去三年,Imagination最大的变化是更换新的CEO、制定公司整体战略以及中国战略。新的战略主要Focos四大应用领域:传统的Mobile,Consumer、Automotive、Data Centre。其中

Automotive是Imagination的传统强项,目前我们的汽车GPU还是市场占有率超过一半。不过,新的GPU既要用于渲染又要用于计算,这是一个新的变化。这也是我们当前面临的挑战之一。”

紧紧抓住中国市场,是Imagination应对挑战的关键策略之一。据刘国军介绍,在过去的两年,Imagination中国业务的增长带动整个新的Imagination在过去的年增长率达到33%。目前,Imagination正在加大中国的生态建设,从整机厂到游戏厂。

 

 

 刘国军表示:“作为Silicon IP的主要提供商,Imagination的成功正是跟整个行业、客户以及合作伙伴一起,生态化发展。希望Imagination拥有这些核心技术以及IP价值位置,能够给中国半导体既有挑战又有机遇、有着非常巨大发展潜力的市场做出我们应有的贡献。”

手机芯片这个功能,有望改变市场格局!

曾经,我们只能在PC或主机端体验到画面细腻精致和流畅的3A游戏,而现在,手机厂商大力投入自研芯片,将光线追踪等技术做到手机里,移动GPU处理性能也越来越强劲。

ABI在2022年的调查显示,手机游戏用户会从26亿增长到2030年的39亿,至2026年85%的游戏玩家首选在手机上玩游戏。显然,光线追踪成为手机征服玩家的利器。

纵观当前市场上的光线追踪方案,针对PC端,英伟达最新发布的Ada Lovelace架构,在光追方面做了不少重大更新;英特尔Arc Alchemist GPU 无论是光追功能还是游戏性能,都给足了玩家期待。

在移动端,三星Exynos 2200 属于较早落地的支持光追的手机,其采用了AMD RDNA 2 架构;高通全新 Adreno GPU 加入了专门的移动光线追踪加速单元;同时以 Imagination、 ARM 为代表的芯片 IP 供应商,陆续推出支持移动光追的 GPU 架构。其中 Imagination 的PowerVR Photon 架构被称为业界首个移动端硬件级光追架构,采用Photon架构的IMG CXT GPU成为了首个在移动端实现桌面级视觉效果的GPU IP。其后一年内ARM 也推出了其首款支持光追硬件加速的GPU IP。

目前来看,可真正落地的移动端光追方案还在初期,但不管是 SoC 芯片商还是手机厂商,包括游戏开发商,都对在移动端上实现光线追踪跃跃欲试。就在今年1月初Imagination 宣布推出IMG DXT 系列 GPU,这款开创性的光追 GPU 将加速该技术的落地和普及,并应对不断增速的手机游戏市场。

应对手机游戏的画质革命

现如今,手机游戏有三个趋势值得重点关注:

• 其一,玩家对游戏沉浸感的体验要求越来越高;

• 其二,对手机性能要求越来越高,任何用户都不可能喜欢在只有5~10帧的场景下游玩游戏;

• 其三,手机功耗引发的电量焦虑需要引起重视,一直在充电或者快速掉电对手机玩家来说都是不可接受的。

Imagination DXT系列GPU为满足手机游戏需求,在设计之初便关注到了上述手机游戏趋势。为了加快光线追踪在移动端的普及,推出了更具设计扩展性的GPU。在IMG DXT图形处理单元中引入了基于PowerVR Photon架构的光线加速集群(RAC)的演变。DXT的重点是通过引入片段着色率(FSR)功能和增强的后处理技术来提高效率,同时改变布局,为光线追踪提供可扩展性和灵活性。

DXT系列GPU的三款产品面向三种机型:主流机更在意单位面积性能,高端机在于更高的性能实现,旗舰机追求更高性能和手机整体表现,Imagination提供不同的算力, 像素填充力和光线追踪的可选RAC (Ray Acceleration Cluster)。

 

 

 光线追踪可以说是Imagination GPU IP的招牌技术之一,该技术可以让3D游戏场景中的光照更加贴近真实生活中的折射和反射。但实现这样的光线折射和漫反射却需要很大的资源开销,早期甚至高端的服务器也需要一定时间来“烘焙”这些画面,而现在,对桌面级GPU渲染实时光追已不再是难题,Imagination推出的高效可扩展光追技术使得主流手机也都能使用此项技术。

光线追踪等级

并非所有形式的光线追踪支持都是相同的。现实情况是,任何具有计算能力的GPU都可以执行光线追踪,但它们之间的区别在于可以执行光线追踪的效率和可以达到的性能水平。因此,Imagination引入了光线追踪等级系统(RTLS)的概念,以突出各种等级光线追踪的效率。

 

 

 需要强调的是,Imagination提供的是第4级别的硬件级光线追踪,且是可扩展的高级光线追踪技术。

在移动端实现光线追踪并非易事,因为移动端的能耗和运算带宽本身受到的限制就比较大,目前市面上绝对大多数光线追踪都是L1、L2级别的。L1级别的光线追踪是纯软件光线追踪,需要消耗大量的CPU资源,L2级别的解决方案中具有判断光线和物体边框及三角形是否相交的检测器,但所有其它RT处理仍保留在着色器代码中,也就还需要额外的GPU计算资源,而到了 L3级以上都需要具有硬件BVH的分类、相关性的回溯处理等专门的光线处理模块。Imagination的CXT和DXT系列提供的都是L4级别的光线追踪。

当然,需要强调的是游戏市场上存在一定误区,很多人认为只要是使用硬件光线追踪,帧率一定会下降,游戏运行一定会更慢,其实这是不正确的一种想法。因为现在游戏中或多或少一定都是用了传统的技术进行光影的渲染,哪怕不加任何新的光线追踪效果,只是把原来的光影效果从传统的渲染方式替换成实时光线追踪,让硬件承担这部分的工作,从而使整体的运算结果更快,让帧率也更高。

集大成之作的性能飞跃

IMG DXT系列产品拥有6个关键技术值得关注:

• Vulkan® 片段着色率(FSR):IMG DXT为 Vulkan 提供了片段着色率 (FSR-Fragment Shading Rate) 支持,为开发者带来了性能上的裕量。FSR在尽可能不影响视觉质量的前提下,减少了处理的片段数量,并大幅提高图形性能。光线追踪技术能很好地和FSR技术结合在一起,配合可扩展RAC,可用更小的RAC实现这个场景下的游戏光追效果,为用户带来更好的沉浸式体验;

• 2D 双速率纹理处理(Dual-Rate Texturing):在其纹理处理单元 (TPU) 中拥有创新的专利特殊模式,可为后处理效果创建“快速通道”。在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。

• 提高纹理和计算性能:采用全新的着色器处理单元 (SPU) 设计。DXT GPU 每个 SPU 的高端计算和纹理 (ALU/TPU) 性能提高 50% 以上,这要归功于全新的三重通用着色器集群(SPU)设计(3个ALU/TPU 单元),而以前的架构只侧重于双USC设计(2个ALU/TPU单元)。

• 流水线数据主控器: 改进流水线后,当前场景正在渲染时,无需任何间隙和等待,数据主控器现在就可以开始为下一个 3D 场景创建工作负载。在提高性能和能效的同时,实现工作负载生成的流水线。

• ALU 寄存器组性能翻番:统一存储的改进提升了 ALU 寄存器组的吞吐量。而且,IMG DXT GPU的ALU寄存器组数量是上一代的两倍。

• RISC-V固件处理器:长期以来,Imagination的GPU一直得益于集成的固件处理器,实现了许多独特的功能,如虚拟化,系统安全隔离等。DXT升级采用了在汽车系列中经过芯片级验证的RISC-V CPU,同时性能提升了40%。因为固件处理器是绘图任务调度的核心,它的升级给DXT带来了全方位的性能改进。

 

 

 Imagination的深谋远虑

与移动端GPU相比,云游戏正在兴起,那么移动端的GPU和放在数据中心中的GPU到底会是什么关系?

Imagination 公司技术产品管理高级总监Stephen Barton认为,Imagination其实也有相应的产品,比如B系列的多核系列产品,具有虚拟化的技术,可以八核对应8个以上的玩家,都享受到服务器端的运算能力,这样可以让大家在自己的设备玩到以服务器的运行性能跑出来的游戏画面表现和品质。

设备端GPU的使用方式与本地跑游戏不同,会是用一种流式传输,更像是放视频的方式,在这种情况下有一个问题在于大家不想去用非常高分辨率的原始画质传输到手持设备上,无论是带宽、流量还是流量费用都会成为一个比较大的负担,会影响到云游戏的发展。云游戏中本地设备上的GPU可能有些新的应用场景,数据中心服务器把一个较低分辨率的游戏内容传到设备上,设备GPU负责把这个画面进一步处理,能够在高分辨率屏幕上看起来也没有那么低的画质,这是未来云游戏在GPU方面产生的变化。

Imagination 公司首席营销官David Harold认为,很多技术路线都还没有明确哪一种会成为最终的赢家,云游戏也是一样的。GPU应用在云游戏中有多个方向可以发展,比如大家最常见、认可最多的云游戏方式就是在本地部署一个轻量级的设备,服务器端有比较强力的运算能力,通过这种方式进行云游戏,但事实上我们也可以把GPU升级部署在本地或者部署在边缘节点,可以是在手机和云端同时具有一个镜像规格的GPU配对,从而进一步加强云游戏的体验,这也都是可能的。

关键的一点是,无论是GPU、AI还是其它的云计算等等方面,都要有相应的技术储备,比如云计算的过程中的数据传输需要应用到压缩的算法,这样的技术储备我们做好了,无论这项技术在市场上怎样发展,我们都有相应的机会抓住。

简单解释来说,就是移动端GPU和数据中心GPU将会是协同的向上的,同时Imagination也在两方面均有布局。

值得一提的是,Imagination一直持续深耕中国市场,据Imagination 公司副总裁兼中国区总经理刘国军介绍,在中国生态建设上,不仅包括整机厂商,还包括各大游戏厂商;公司的生态团队在国内周期性、规律性地举办各种培训以及会议,与主流游戏厂商,GPU相关开发者面对面或线上交流。

 

 

 

 

参考文献了解

https://mp.weixin.qq.com/s/OG0kkrKpMJtLJjg2mkDSEg

https://mp.weixin.qq.com/s/kHZaCuT4lMSWD7NO68RVfw

posted @ 2023-02-01 03:42  吴建明wujianming  阅读(218)  评论(0编辑  收藏  举报