[3D加速后又一全新理念]
3D显卡的诞生令人们可以通过显示设备领略到“十分真实”的画面,在1996年,几乎所有市面上出现的显卡产品都宣称拥有一定的3D处理能力,不过当时它们大多只是通过显卡芯片完成常规画面渲染工作,而3D场景模型构建和光照效果运算都是通过专门的软件算法由CPU来处理。包括当时的API也没有统一的标准,实际的3D效果可谓十分有限。不过1997年,随着第一块3D加速卡Voodoo的问世,人们才终于领略到真正的3D游戏画面。在那个只靠CPU来完成大量图形计算的时代,Voodoo让人们见识到了3D加速技术的魅力,各种滤镜效果、性线过滤、抗锯齿等3D特效技术把3D游戏的画面提高到了一个全新的层次,人们也才清楚3D加速的概念。1998年第一款GPU芯片GeForce256出现后,其内置的硬件T&L(几何转换和光源处理)引擎,可以直接完成场景构建和光照运算,大幅提升了显卡3D性能并降低了CPU的负担,从此人们有了完整的3D加速引擎的概念。这一次3D加速革命,也为图像处理技术的发展指明了方向,同时也造就今天的nVIDIA、ATI等著名厂商。

但是,从此之后显卡就再也没有什么革命性的进展。在这漫长的10年之中,一代又一代的显卡芯片除了频率不断提升、制造工艺改进、渲染管线增加之外,并没有任何质的改变。只是从架构上来看,即便是目前最高端的7900GTX和X1900XTX,在架构上和他们的老前辈也并没有什么区别。
而现在的大型3D游戏中,为了使游戏的画面更加的真实,开发人员就会在游戏中设计许多接近现实的物理计算,比如:自由落体,物体运动,空气流动,力的反弹以及各种物体间碰撞等等。但是在传统的计算机中,游戏的物理运算基本上是通过物理引擎加上CPU处理后的物理参数后再反馈到中游戏之中,这种方式往往在遇到大规模的物理运算时就会出现运算瓶颈,这也就造成了游戏中一旦出现大量物理运算时,帧数就会明显下降。那么如果来解决这个问题呢,在Game Developers Conference (GDC)2005游戏开发者大会上,一家来自美国的半导体生产厂商AGEIA给我们一个非常好的答案——PPU。

[PPU——物理加速引擎]
PPU——Physics Processing Unit(物理运算处理器),如果CPU是为了达到更快的运算速度,GPU是为了达到更好的图像效果,那么PPU就是为了使游戏更加真实。在以前的3D游戏中,大多数的背景和物体都只是一些静态的贴图效果,真实感较差。而在FPS游戏大作Half Life 2(半条命2)中,Havok物理引擎带给了玩家们一个非常真实的物理世界。你可以在游戏中捡起一个废纸盒,然后把它抛向远处,然后可以看见它撞击到墙壁以后反弹到上地面上,溅起一阵灰尘。接近于真实物理效果使得游戏中任何物体都是可移动的,它们都遵守着游戏中的物理参数,组成了一个“真实”的游戏世界。

PPU的出现可以说为图像处理技术的指明了新的方向,显卡并不再是像以前一样只是单一的工艺进步、频率提升、管线堆叠,而是需要采用不同方式的处理技术。加入了PPU负责单独的物理运算后,GPU便可以专心负责进行图像的渲染和显示,CPU则进行两者之间的综合协调。PPU的出现将物理计算和图像处理分开运算可以创造出更加生动的和真实游戏环境,这可能引领新一轮的3D技术革命。而玩家也将体验到像电影中的一样的壮观场面,各种物体爆炸、撞击、建筑物倒塌等等。有了PPU的辅助以后,可以很轻松的实现各种复杂的碰撞或者运动效果。这种小到一粒沙也会因为空气的流动而移动的场面,令游戏的可玩性、真实性是以前传统的任何一款3D游戏难以比拟的。
但是同时PPU有着和GPU完全不同的内部构架,PPU将拥有软、固质体动力,泛用碰撞侦测,有限元素分析,流体动力,毛发模拟,布料模拟等技术特效。PPU的这些处理技术和GPU是完全不同的两个运算概念,因为物理运算需要十分强大的整数及浮点运算能力,GPU的性能则是将重点放在了画面的渲染效果上,追求单纯的视觉效果,而PPU所强调的是“真实性”。
如此真实的表现真是令人期待,下面我们就先来了解一下全球首款硬件加速物理运算处理器,来自AGEIA的PhysX。

[PhysX横空出世]
2005年3月19日,美国无晶圆半导体厂商AGEIA于游戏开发者论坛(Game Developers Conference, GDC)上发表了全球第一款采用硬件加速的物理运算处理器(PHYsics Processing Unit, PPU),同时将其命名为PhysX。AGEIA称它将会出现在下一代包括PC和游戏主机中。
AEGIA在发布PPU时这样解释:以90年代末被称为GPU的图形处理器为例,早期复杂的3D图形往往需要通过软件配合CPU的运算才能得以实现,而GPU的出现正好接过了CPU的这部分工作,我们的PC开始通过GPU完成对3D图形的运算,当然它并没有完全脱离CPU。AEGIA认为GPU的出现降低了CPU的工作负担,同时为用户提供了更加完美视觉效果和图形效果,而PPU的出现也是如此,它将原本必须依赖软件技术并通过CPU的运算才能完成的工作交给专门负责物理运算的硬件来完成,这样,PPU开始向CPU、GPU一样进入我们的PC。

游戏性能三种重要因素:CPU、GPU和PPU(物理运算处理器)。
PhysX在游戏画面上带来一些较为显著的改变包括:
由于爆炸所引起的烟尘和碎片的效果
通过制造更加复杂、节点更多的几何图形来形成更为逼真、交互性更强的动作
包括人物的服装、眼泪等细节都会和真实的场景一模一样
当风吹过衣物、或者树叶之类时,物体会呈现出自然的摆动
环绕在物体周围的浓烟&尘雾将会形成一种运动的效果
在今年的E3大展上,AGEIA也首次公布了PhysX的PPU Demo,在第一个Demo场景中,约有4200个多边型石块从一个山坡上滚下来,在运动的过程中,每块石头都以不同的物理条件自由下落,石头会因为高度、速度、重力及撞击而改变运动规则,它创造的完全是一个“真实”的客观世界,不再是以前游戏中每个物体的移动都是按照计算好的路线进行运动。既然需要拥有如此强大的物理运算能力,那么拥有强大性能的双核心CPU是否会更少的依赖PPU的工作呢? AGEIA则认为PPU的作用是无法替代的。因为目前的CPU在游戏中可以处理1000个左右的可自由移动的多边物体,而目前的PPU可以达到32000个,如果驱动程序升级改进以后,可以达到40000~50000个。所以说PPU在游戏中物理运算的重要地位是难以替代的。
[关于AGEIA]
在05年GDC上,一家名不见经传的美国半导体设计厂商Ageia发表了世界上第一颗采硬件加速物理运算处理器(Physics Processing Unit, PPU)“PhysX”,很快在世界上引起了一场物理加速的轩然大波。

AGEIA的计划主要推广该公司的软件产品physics API,该软件起初被称之为Novodex,但是后来被更名为PhysX。
根据AGEIA公司的设想,PPU和CPU以及GPU的关系成为一个相辅相成,共同运算的关系由于PPU能够代替CPU进行大部分的物理计算任务,因此可以使得处理器能够更加快速得与GPU进行数据交换从而使得游戏运行更加平稳。


为了给游戏开发商提供便利,AGEIA公司准备了NovodeX SDK开发包来完成这个使命。该软件不但包含了业界先进的Novodex物理模拟引擎,而且它还可以作为现在主流的的3D建模开发工具以及微软的XNA开发工具的插件运行,开发人员只要通过拖放和点击就能完成对目标施加物理模拟效果,这对于任何专业的开发人员将都不是什么难事。 Ageia早先表示只要游戏开发商支持PhysX物理卡,就可以免费使用PhysX物理引擎和其它相关的技术支持。这吸引了许多一线游戏包括幽灵行动3、X战警2-天启降临、City of Villians等的开发商,虚幻3也将支持PhysX物理卡并使用PhysX引擎,这意味着将来众多的虚幻3引擎游戏都将同时支持PhysX。
Ageia公司的创始人一共有五位,他们是在美国一家名为MinMax technologies的半导体设计公司们共事相识的。当时团队研发了业界第一块基于网络处理器的大型交换机,当完成这个项目后,他们几个人聚在一起决定开创自己事业,于是就有了现在的Ageia公司。新公司首先研发了业界首款三芯片10 Gps数据处理能力的网络处理器,接下来他们决定尝试一些能带来更大影响力和革命性的东西,于是就有了今天的“PhysX”。

[物力加速的全盘解决方案]
随着游戏画面的发展、电脑AI的更加复杂化,再加上物理运算已经使CPU不堪重负,因此业界除了AGEIA外,其它一些有实力的厂商当然不会作壁上观。目前业界的解决方案有3种:物理引擎专业商Ageia制造独立的PhysX物理加速卡; Nvidia同Havok协力研究的“SLI物理卡”加速技术;ATI则在加紧研究提高其显卡的物理运算能力,三种方案虽然都能够提供物理加速,但是在技术上又有很大不同。
Ageia推出革命性的PhysX物理卡并制订了长远的计划来同时发展软件的PhysX物理引擎和硬件的PhysX物理卡。软件的PhysX物理引擎在PC、PS3和XBOX360上都有广泛运用,例如半条命2中运用的rag dolls(布娃娃)物理引擎等。
硬件的PhysX物理卡则是IT业界的一项革命,独立的物理卡要比CPU和GPU模拟物理运算更快更专业,先前Ageia用PhysX物理卡展示了一款8人对战游戏,游戏中有数百个目标你可以把它们移动、毁灭,每一个物体的位置、外型并不是事先设计好,而是实时运算出来的。同时计算数千个物体的活动轨迹和破碎画面,过去是CPU和显卡所无法负担的。


[物理加速——NVIDIA篇]
NVIDIA提出了“SLI物理卡”的概念,这项技术由NVIDIA和Havok共同研发。Havok是一家专业的物理引擎设计公司,许多著名的游戏如帝国3、半条命2、F.E.A.R、光晕2等都使用了其Havok物理引擎。去年10月,Havok宣布最新的物理引擎Havok FX即将完成,这也正是NVIDIA “SLI物理卡”的技术基础。
Havok FX物理引擎,其是可以让任何支持Shader Model 3.0的显卡极大提高物理运算能力的开发软件。现在Havok FX的BETE版已经面世了,正式版将于夏季发布。Havok还没有透露该API的详情,但表示使用Havok FX技术后,NVIDIA显卡将可以加快电脑物理运算的速度。NVIDIA首席科学家David Kirk称:让GPU负责物理计算是适合的,目前GPU的速度和高可编程性完全可以兼顾物理运算。游戏开发商通过GPU上各种高级的可编程资源,在GPU上进行并行模拟运算得到了良好的结果。


目前NVIDIA正在与Havok共同研究Havok FX引擎与显卡的兼容性。虽然Havok FX只需要一块显卡就可以运行,但NVIDIA希望研究出基于SLI技术的更强物理引擎:2块NVIDIA显卡通过SLI主板互连,在不需要太多物理运算的游戏中以普通SLI模式运行;在大量物理运算需要的游戏中则划分一块显卡专门负责物理运算,或者由2块显卡动态分配任务。

显然NVIDIA计划借此次物理卡的浪潮同时扩大在主板、显卡、物理卡3个领域的影响力,因为要实现“SLI物理卡”必须购买2块NVIDIA显卡和1块NVIDIA SLI主板,而不需要Ageia的PhysX物理卡。

[物理加速——ATi篇]
Havok FX只需要支持Shader Model 3.0的显卡,而不是仅为NVIDIA显卡可用。所以ATI将来也可以同样提出基于CrossFire的互连方案。ATI称其在动态渲染管线分配技术的领先、与Microsoft在DX10技术的紧密联系等优势会让ATI比竞争对手更强大。

ATI称其R520和R580架构本身具备物理处理功能,该功能可以通过软件方式达到。不久ATI就会给各软件开发商提供新的API以改进Pixel shader,新的DPP(并行数据处理)技术将使显示芯片绕过Direct3D API,同步处理物理数据和pixel shader数据。ATI称这一改进将在让GPU加强物理运算能力的同时还可以极大的提高GPU运算所有浮点指令的速度,这一多用途的改进方案将使ATI显卡在流体处理、视频处理等多方面受益。

Havok FX将物理数据转换为Direct3D数据,从而使任何Shader Model 3.0显卡都可以直接运算。而ATI的最新API可以让开发商使用GPU来加强运算多种物理或浮点数据,从而直接运算物理数据。开发人员可以开发出多种软件使显卡加强不同能力来应对不同运用。这种高自由的开放性API使它受到了欢迎。但是ATI的这一方案也需要专门的开发团队支持,如果是拥有Havok FX的厂商会比较方便,而没有Havok FX的厂商就只有自己设计复杂的转换程序了。
[Physx全新面世]
现实之中的PhysX芯片PPU子卡经过去年的跳票之后,终于将要开始面市了。上一次Ageia公司跳票的理由是支持PPU的游戏并不多,应用不够丰富。而现在已经有包括SEGA、Ubisoft和EPIC在内的多价游戏公司表示了对PPU的支持,目前已经有包括国家的崛起之崛起传奇、Ghost Recon 3(幽灵行动 3)、City of Villians、虚幻竞技场2007等多款游戏正式支持PPU加速子卡。







目前被授权生产物理加速卡的只有只有华硕和美国BFG两家,目前影驰已经获得了BFG的正式授权,在包括中国大陆,香港,韩国,日本等亚洲地区开始销售BFG的Ageia PhysX卡。

[影驰代理的BFG 物理加速卡]











影驰作为国内知名显卡厂商,推出的产品经常采用自己的PCB优化设计,并且超频性能极高,成为DIY玩家首选的品牌之一。而此次影驰在国内独家代理BFG的物理加速卡又是为广大玩家提供了最新的物理加速体验。

BFG物理可以处理游戏中的流体、烟雾、雨滴、碎片等物体,可以呈现出逼真的可互动环境,将原先由CPU、GPU完成的物理引擎处理器工作接管,可以在提供更真实环境的同时加快游戏的运行处理速度。

[影驰代理的BFG物理卡详细参数]




在散热器下面你可以看到PhysX物理处理器以及容量为128M的板载128-bit GDDR3显存,其中PhysX物理处理器的核心频率为733MHZ(显存为1466 MHz),其总带宽可以达到12 GB/s。

AGEIA表示该芯片的峰值指令位宽为200亿/秒。根据AGEIA公司的白皮书该物理器可以支持每秒5.3亿球体对球体碰撞(sphere-to-sphere)曲面对曲面(Convex-Convex )碰撞最大为533000/秒。在生产方面,PhysX使用了TSMC公司0.13微米的生产工艺,其内部集成了约1亿2千500万个晶体管。核心大小为182平方毫米。与NVIDIA最近的G71非常相近(G71为196平方毫米)。

AGEIA公司把这个处理器称之为“highly tuned multi-core processor”(高和谐多核心处理器)而最后一句话也指出PhysX物理处理器能够支持驱动以及firmware升级,通过升级将可以使得PhysX物理处理器支持新的功能。举个例子,AGEIA在起初为开发者提供的软件中并不支持布料处理,而在最新版本中当前的PPU用户则已经可以免费使用。
使用物理加速卡可以降低系统在运行对应游戏时的系统负担,不过同样对于系统有最低配置要求:
  CPU:1.4GHz以上;
  内存:128MB以上;
  操作系统:Windows XP各版本;
  电源:300W;
  显卡:支持微软DirectX SM 2.0或以上;

macs 2006-07-13 16:50
[BFG物理卡测试平台及驱动]







这里你可以看到你安装诉PhysX引擎的版本,我们这里安装的版本是2.4.2,不过Cell Factor demo中则是2.4.9。看起来每一个游戏开发商都可以定制自己的PhysX引擎并使用到自己的软件中。

菜单中附带一个DEMO。这个DEMO运行起来比较简单,即发射一枚球然后对积木进行撞击。

在“settings”栏目下提供了各种各样的诊断测试项目,你可以通过运行这些测试项目以了解软硬件工作是否正常。



[AGEIA DEMO测试]















这个测试非常简单,在没有开启PhysX硬件加速时也可以运行,不过此时所有计算都将由CPU负责。我们看到,PhysX硬件加速至少可以带来10%以上的提升,这是在CPU使用的FX55时的情况。在使用P4 3.2GHz时,我们发现使用硬件加速的优势会更加明显,看来PhysX引擎对双核及协处理方面还是有一定优化,虽然P4 3.2GHz只是开启了HT技术。

[其他支持应用演示]

例如一些科学模拟计算等领域,物理加速的应用仍十分广泛,相信在未来的应用软件中,物理卡的意义也会突现,下面是一些可以支持物理加速软件的演示。























不过目前我们最关心的仍然是AGEIA PhysX物理加速在游戏中的表现,下面我们就对几款可以支持物理加速的游戏及DEMO进行详细的测试。

[Cell Factor游戏体验]

Cell Factor这款游戏目前仍然研发之中,不过这款游戏只有在安装了PhysX PPU之后才能够正常运行。《细胞因子》(CellFactor)是一款科幻恐怖类型的FPS游戏,描述在未来世界因为半人半机械的“合成人”产生错乱,会主动猎杀攻击人类,而玩家扮演的主角Dante Aligheiri,就是专门猎杀狂暴化合成人的特殊作战小队队长,率领四人一组的作战小队,而在充满杀戮危机的科幻世界展开属于人类与机械之间的战斗。 从公开的画面可以看到本作运用了很多真实引擎的电影化效果,例如动态模糊、场景纵深等,而爆炸效果也非常惊人。

下面选择一个场景,向堆积的物体开枪,我们来看看效果。















作为一款肩负着PhysX物理卡崛起这一重任的游戏来说,自从去年年中公布时并不引人注意。而现在,随着PhysX物理卡的推出,其关注度也在日渐提升,以上面出色的物理运算性能可谓令人目瞪口呆。

[Cell Factor性能测试]

测试中我们选择了三个场景,尽量保持同样的动作,用Fraps纪录帧数。





即使我们使用的是7900GTX,游戏始终只能运行在20FSB左右,当然因为是游戏DEMO,驱动还不购成熟,再者如此“旋”的画面对于任何显卡都是一个严峻的考验。

当然有戏中也可以关闭物理加速及特效,但是显示效果就非常普通了,游戏中所有的物体都变成固定的。而打开物理加速后,画面上每一个物件都在可以在你的攻击下漫天飞舞,这种技术上的炫耀令人体验了游戏从未有过的爽快。

[Ghost Recon游戏画面对比]
育碧《幽灵行动:尖峰战士》(Ghost Recon Advanced Warfighter)PC版已经是正式压盘的游戏。尽管PC版与其他版本的名称都是《尖峰战士》,但是游戏中的特色还是有很大的不同。首先,PC版由瑞典的GRIN工作室开发的,采用自己的图像引擎。《尖峰战士》也是世界上还为数不多的支持Aegia的PhysX物理处理器的游戏。
由于Ghost Recon这款游戏PhysX PPU提供了支持,这也是目前唯一一款能够在安装加速卡和不安装加速卡这两种情况下都能够正常运行的游戏。我们就可以比较直观的对比前后的画面差异。
在Ghost Recon这款游戏中,PhysX PPU并不需要用户去完成相关的设置,因为这里并没有提供什么可以关闭或者打开的选项。如果你安装了PhysX PPU,那么相关的物理处理任务就会交由它来完成,如果没有安装PhysX PPU那么则就交由处理器来完成。

关闭PhysX PPU

开启PhysX PPU

关闭PhysX PPU

开启PhysX PPU
上面对比的场景是在游戏中使用手雷炸掉一辆汽车,当安装了PhysX 加速卡之后你会发现在爆炸画面中会出现更多的碎片从被摧毁的汽车中飞出。

关闭PhysX PPU

开启PhysX PPU
同样的,在安装了PhysX PPU之后,你可以看到更多的飞溅物,虽然在第一张图中的画面表现已经很不错了,但是当安装PhysX PPU之后,飞溅的粒子体积要更小,数量也更多。

[GHOST Recon 性能测试]

测试中我们采用低、中、高三种测试环境。













开启PhysX PPU后对画面的影响显而易见,但在整体性能上会对游戏带来什么影响呢,可以肯定当使用PPU之后游戏整体性能会略微下降,这主要是因为在游戏中产生的额外物体需要GPU进行贴图与渲染,这样就增加了GPU的负担。



我们也测试了启用物理加速与否在游戏中CPU占用率的影响,如图所示,运用物理加速后,CPU占用率有明显降低,关闭物理加速时基本达到100%占用率。无论如何,我们可以在CPU负荷更低的情况下,提供了更为出色的游戏画面表现,当然其功劳来自PhysX 物理加速卡。

[PPU前景展望]
虽然PhysX的性能强劲,但是能否得到广大游戏开发商的支持就尤为重要了。 AGEIA在发布PhysX物理处理器的同时也发布了Novodex SDK软件开发包,这款SDK也是全球第一部异步(多线程)软件开发包,可以充分发挥多核心处理器的优势。而著名的EPIC公司甚至表示会把AGEIA的这项技术整合到它们的所开发的次世代Unreal 3.0引擎上,而Unreal 3.0引擎也是Xbox360主机的指定3D引擎工具,可以看出微软对于PhysX的前景是十分看好的。同时在E3大展上,索尼也宣布它的次世代主机PS3也会和Xbox360一样提供对PhysX的支持,看来物理处理器已经成为下一代3D游戏平台的主流配置。
《虚幻竞技场2007》PC版游戏内建了对Ageia物理卡的支持,这就意味着游戏效果将更加惊人。

而著名的游戏开发商Ubisoft也表现将在下一代的游戏中采用AGEIA的PPU技术,并提供对PhysX物理加速卡的支持,这些游戏包括:Rise of Nations:Rise of Legends(国家的崛起:崛起传奇)、Ghost Recon 3(幽灵行动 3)、City of Villians等等全新游戏。而目前另一款支持物理加速卡的游戏马上就要和广大的游戏玩家见面了,它就是由英国的游戏开发商Digital Jesters发行的Bet on Soldier(赌命战士),这是一款非常独特的第一人射击类游戏,此款游戏提供了对64位技术和物理加速卡的支持,相信游戏发行之时,一定会带给大家一种全新的游戏感受。
看来PhysX的表现还是得到了广大厂商的认可,现在唯一需要的就等待更多的支持物理加速的游戏大作了。

[开创新时代]
相信PhysX物理加速卡已经给大家留下了深刻的印象,通过它我们可以在游戏中感受更多的真实物理效果。其也将给未来游戏带来全新的体验,3D游戏中的运动将不再是按照预定的方式进行,而将是通过遵循多种运动定律的运算得到。而在没有PPU的系统中,哪怕你使用的是最为昂贵的显卡,你所看到的场景将是一成不便的,缺乏变化。

现在对于PPU的推广来说最大的因素有两个:
第一就是其价格。目前其价格在300美元左右,已经和一块高端的显卡相当。但是相信对乐于享受最佳游戏效果的玩家,PhysX仍然会成为首选,因为对于他们顶级的配置,PhysX物理卡的价钱占总体开支还算合理。不过对于大众阶层,目前必然很难接受。
再者就是游戏的支持。用户是否需要购买物理卡最终是取决于游戏的,这一情景和十年前显卡的独立非常相似。当时的Quake全新3D画面使用户认识到显卡的重要性,而现在,支持独立物理运算的游戏在画面上也将再一次出现飞跃。如上面测试中画面对比,在拥有PhysX物理卡的模式中,人们将会得到完全真实的世界,这种变革甚至不亚于10年前2D至3D的革命。
最后我们引用一段十年前媒体对Voodoo显卡的评价:
“Voodoo 显卡在设计上可以说是独一无二,作为一片3D子卡,本身不包括任何2D输出能力。根据运行程序的支持,自动切换到子卡上运行输出。业界的许多厂商,包括微软都怀疑人们是否真的愿意为改善游戏体验为高达500美元纯3D显卡买单。而1996的春季储存器市场的巨跌无疑是老天对3Dfx公司的眷顾,最终Voodoo子卡以大约300美元的价格开发发售,市场的热销表明该产品真的成功了。”

AGEIA正在努力去创造出一种全新的游戏环境,而它也将这种改变称为Gaming Power Triangle(游戏性能铁三角),即CPU+GPU+PPU!
posted on 2006-08-22 09:34  王大牛的幸福生活  阅读(2250)  评论(0编辑  收藏  举报