第5页:全新的像素渲染引擎Part II

Radeon X1800的核心能够同时处理512个执行绪,并且能够以4×4的模式来执行Pixel Blocks,大幅度的提高了Shader Model 3.0中的DB指令的执行效率(Dynamic Branching)。

在整个的渲染过程中,如果Ultra Threaded Pixel Shader引擎发现了有Pixel Shader单元处于空闲状态,那么引擎降会立即向Pixel Shader单元发出新执行绪;而如果闲置的原因是在等待其他Pixel Shader单元的结果,那么Ultra Threaded Pixel Shader引擎降会结束其当前的工作,然后给它分配其他的指令。

从Pixel Shader来看,Radeon X1800系列的Pixel Shader和原来的R4XX的区别并不大,唯一不同的是增加了一个分支单元,并且计算精度从SM2.0的FP24提高到SM3.0的FP32。nVIDIA方面,7800GTX有两个能够运行MADD指令的4D ALU,这两个ALU都能够以4D、1D/3D、2D/2D的方式完成指令,在运算能力上,要强于Radeon X1800。7800GTX的ALU0上还具有一条能够执行FP16的NRM指令。这对于UE3中大量使用的Normal Mapping计算有非常明显的加速作用,但是7800GTX的ALU0承担了纹理寻址地址的计算,在遇到纹理操作的时候,ALU0就不可能执行像素着色器指令,而只执行纹理操作指令,只留下了ALU1执行像素着色器的指令。

第6页:创新的512bit环状显存总线架构

Radeon X1800除了提升了Pixel shader引擎的效率外,ATi在Radeon X1800核心中采用了全新设计的512bit环状总线架构,512bit环状总线是由两组按照不同方向运行的256bit环线组成,环状总线围绕在核心的周围,这就代表着:任何时候,内核的任何部分,都能够处于最短的连接状态,达到了降低延迟的目的,提高了运行频率。

由于拥有512bit环状总线架构的存在,X1800可以支持频率更好的GDDR3或者是GDDR4显存,最大能够提供48GB/s的显存带宽。再环状总线上,有4个被称作Ring Stop的连接点,每个Ring Stop都拥有两条32bit存取通道,这些Ring Stop连接点,同时还提供了例如可编程仲裁逻辑处理的能力,可以通过驱动程序的智能参数设定,为特定的应用程序设定优先处理,让显存控制器优先处理对性能影响最大的数据请求。另外,Ring Stop还能够支持参数调节,只需要更新显卡的驱动就可以对显存控制器进行优化。

X1800同时引入了联合缓存存储的工作模式来提升显存的性能,在这个架构中,缓存不再是单一的映射到特定的一个或者几个显存地址,而是在任意情况下都可以映射到任意空闲的显存;在相同的频率下,联合缓存架构的工作效率要远远高于直接映射缓存。

同时,改进后的Hyper Z技术采用了更复杂、智能的算法,可以更加有效的减少对于隐藏部分的渲染,节约了显存的带宽,这样将可以在FSAA和AF开启时,拥有更好的表现。

第7页:自适应抗锯齿

之前我们说过,改进后的Hyper Z技术可以在FSAA和AF开启的时候,拥有更好的表现,而Radeon X1800同时引入了一种更加优越的反锯齿模式:自适应反锯齿(Adaptive AA),这种技术能够支持多取样反锯齿模式和超级取样,并且可以更具画面中物体的不同特性,自动切换不同的取样方式。

在绝大多数情况下,Radeon X1800会执行多取样方式对画面进行反锯齿处理,而当遇到类似铁丝网和植物等经过阿尔法混合方式生成的对象的时候,就能够自动切换到超级取样的方式,这样能够提高反锯齿的图像品质。

全角度异性过滤(Ainsotropic Fitering)也是ATi在X1800上应用的一种新的异性过滤方式,这种模式的出现,改善了三线性过滤的效果,并且采用了新的算法,使得X1000系列显卡在打开Area Ainsotropic Fiter的时候,对性能影响非常小。

第8页:HDR 高动态范围渲染

虽然ATi较nVIDIA,较晚的引入了HDR(nVIDIA在NV40中就推出了HDR技术),HDR最令人向往之处就是可以让游戏变得更符合现实,符合人眼见到的景物。其主要原理就是通过光影的运用。X1800在增加对HDR支持的同时,同样加入了16bit Floating Point Precision,提供了64bit的高动态渲染,并且可以在16bit Floating Point Blending和MSAA运行的时候,同时运行HDR。

其实,除了支持HDR外,X1800还同时支持INT10格式,提供了比一般RGBA8更高的精度,支持10亿种色彩,和4级有限度的透明度,同时不会造成太大的性能损耗和内存占用,并且INT10还同时支持混合操作以及反锯齿。

第9页:CrossFire交叉火力

作为ATi应对nVIDIA SLi技术的主要技术,CrossFire在推出至今还没有大量上市,带有CrossFire Edition芯片的CrossFire主卡更是少的可怜,加上驱动程序的原因,ATi的CrossFire可以说是多灾多难。根据ATi官方提供的信息,ATi在X1000系列显卡上降会完全应用CrossFire技术,从高端的X1800到低端的1300均会有CrossFire版本出现。

不过,X1300的CrossFire是不支持Composition引擎的CrossFire,类似于无桥接的SLI,两块显卡的通讯主要是通过PCI Expresss x16总线,并且同样会支持四种模式,包括AFR、Scissor、SuperTiting和SuperAA Reading模式。


posted on 2006-01-18 09:17  王大牛的幸福生活  阅读(994)  评论(0编辑  收藏  举报