ATi的救赎——X1000系列显卡技术详细解析(zz)

第1页：显卡市场——没有硝烟的战场

现在能够在显卡市场上驰骋的，只有ATi和nVIDIA，虽然市场上依旧还有XGI和S3的身影，但这两家公司，并不是，也不能够引领显卡技术的发展。ATi和nVIDIA的竞争可以说已经日趋白热化——从8500 Vs Ti 500开始，ATi和nVIDIA每次“战争”之间间隔的时间越来越短，相反的，每次“战争”的则越来越激烈。

距离ATi和nVIDIA的上一次战争已经一年有余，在上一次的战争中，双方有输有赢——nVIDIA凭借NV40的出色表现，打败了R420，赢得了高端显卡之王的宝座；而ATi却凭借着Radeon 9550的风光，横扫中低端显卡市场，赚了大笔大笔的钞票。

两家显示巨头的竞争还在继续，时间进入了2005年，由于ATi和nVIDIA分别为Xbox360和PS3开发图形显示核心，所以两家公司、以及其显示核心的曝光率又提高了不少，对于Xbox360和PS3两款游戏机的图形显示核心的优劣，SONY迷们和Xbox粉丝各有不同的看法；同样的，DIYer对于nVIDIA和ATi面向桌面市场的产品也是充满了期待。

nVIDIA在今年的6月率先拿出了研发代号为G70的顶级显卡GeForce 7800GTX，拥有超强的性能和多项新技术，并且可超频性非常不错，但是，今天的主角不是GeForce 7800GTX，而是ATi的R520。

小贴士：关于GeForce 7800GTX的超频

小熊在线曾经在9月举办了DFI 钻石杯Lanparty超频比赛，小熊的高手亦有参加，因为大家本身都是月光族，所以小熊高手使用的显卡，均为厂商送测的GeForce7800GTX，当时小熊一共有两块7800GTX，任何一块都可以稳定在500MHz的频率上，这对于高端卡来说，已经是比较不容易的——因为7800GTX当时全部都是公板设计，所以就可以见解反映出：其他的GeForce 7800GTX的频率基本上可以轻松达到500MHz。

在经过了3次的Re-tape和多次跳票之后，ATi在今年的10月份拿出了Fans期待以久的Radeon X1000系列显卡，但仅仅是发布，在2个月后的今天，才逐渐有产品上市。

第2页：Radeon X1000系列产品线简介

和GeForce 7800系列有所不同，ATi一次性发布了Radeon X1000系列的产品。Radeon X1000系列一共分为高端Radeon X1800XT、XL；中端Radeon X1600XT、Pro和低端的Radeon X1300Pro、标准版、HyperMemeoy。面向高端、中端、低端的芯片，核心代号分别为R520、RV530和RV515，其中RV530和RV515均为R520的衍生产品。

作为ATi的高端产品，Radeon X1800系列拥有16条象素渲染管线和8个顶点渲染通道，而在象素渲染管线决定大部分性能的今天，Radeon X1800面对GeForce 7800GTX的24条管线和GeForce 7800GT的20条管线，还是有一定的差距的。于是ATi就利用了90纳米Low-K制造工艺能够实现高频率的优势，将Radeon X1800的核心频率设定到了625MHz，要比7800GTX高超过了45％；另外，Radeon X1800采用了1.5GHz的超高频率显存，在显存带宽的指标上，占据了一定的优势。而频率上的优势，则让Radeon X1800和7800GTX的竞争中不会处于劣势。

让人不解的是：虽然Radeon X1800只拥有16条渲染管线，可是依旧集成了3亿2000万个晶体管，比GeForce 7800GTX还要多出1800万，所以Radeon X1800是否拥有24管线的产品，还是一个谜。在制造工艺上，TMSC 0.09微米Low-K制造工艺能够有效的降低互连线之间的分布电容，并且避免寄生电容，使得频率可以有10％以上的提升。只是90纳米制造工艺在ATi身上应用的并不是十分顺利，ATi也因为这个原因，多次推迟了Radeon X1000系列的发布，当然，问题总是会解决的，Radeon X1000系列终于实现了量产，推向了市场。

Radeon X1600系列是X1000产品线中的中端产品，我们可以将其看成Radeon X1800的缩水版，Radeon X1600只有5个顶点渲染通道和12条象素渲染管线，核心集成了1亿5700万个晶体管，核心频率590MHz，并且搭配了1.38GHz的显存；不过Radeon X1600Pro的频率有明显的降低，分别只有500/780MHz，和XT的差距非常明显。

Radeon X1000系列的低端产品Radeon X1300只拥有4条象素渲染管线和2个顶点渲染引擎，分为Pro、标准版和HyperMemory版，其中Pro和标准版的核心频率为600MHz，显存频率800MHz，而HyperMemory的核心频率为450MHz，集成32MB显存，提供了共享系统内存作为显存的解决方案。为了弥补显存容量上的不足，HyperMemory版采用了频率高达1GHz的显存，大大提升了显存的性能。

虽然在硬件规格上有一些差别，但是Radeon X1000系列在架构上采用相同的架构，所以在功能特性方面，也都完全相同。例如超执行渲染引擎架构、完美支持SM 3.0的渲染单元等等。其中象素渲染部分被重新优化，引入多线程技术以提高效率；引入了双向内存读取环路技术来提高显存的利用效率，全相连的技术提高了Cache的命中率，并且通过改进的HyperZ压缩技术实现了显存的有效利用。

Radeon X1000通过HDR、Adaptive AA等技术，提高了3D影像的画质，并且同时保证了系统的性能，支持ATi独特的AVIVO技术，能够轻松完成HDTV影像的回放，帮助用户进行视频采集、编码、解码、格式转换等操作，其中大部分运算任务均为ATi VPU承担，可以明显的降低CPU的占有率。

第3页：Radeon X1000系列显卡技术解析

在为大家介绍Radeon X1000系列显卡的技术之前，我想先说说Radeon X1000系列产品的一些主要技术特性。

Radeon X1800的主要特性：

Ultra Theareding Dispatch Processor有效的减少了空闲，提高了效率

512bit Ring Bus Memory Controller架构，提高了显存带宽的利用率

硬件支持Shader Model 3.0和HDR全速128bit渲染

自适应反锯齿模式，在性能和画质之间选取一个平衡点，能够取得最好的效果。

支持AVIVO影像处理技术，加速MPEG4解码

Radeon X1600的主要特性：

支持Ultra Theareding Dispatch Processor引擎

基于256bit Ring Bus Memory Controller架构

支持Shader Model 3.0和HDR

支持ATi自适应抗锯齿

支持AVIVO影像处理技术

Radeon X1300的主要特性：

支持Ultra Theareding Dispatch Processor引擎

基于256bit Ring Bus Memory Controller架构

支持Shader Model 3.0和HDR

支持ATi自适应抗锯齿

支持AVIVO影像处理技术

支持ATi HpyerMemory技术

Radeon X1800作为ATi的新旗舰产品，采用了TMSC Low-K0.09微米制造工艺制造，内部集成了超过3.2亿个晶体管，要比其竞争对手nVIDIA GeForce 7800GTX还要多出1800万个，同时，其核心晶体管数目也是R480的两倍。

『 ATi Radeon X1800核心显微图』

ATi Radeon X1800显示核心创造了目前显示芯片市场上的多个第一——第一款使用90nm制造工艺的显示核心、集成最多晶体管的显示核心、频率突破600MHz的显示核心。虽然ATi的Radeon X1800在几个非常重要的性能参数上都取得了领先，但制造工艺的不成熟，让ATi Radeon X1800显示核心中仅仅集成了16条象素渲染管线和8个顶点渲染通道，16条和GeForce 7800GTX的24条相差50％，和传闻中的32条渲染管线更是相差甚远。

虽然只有16条渲染管线和8个顶点渲染通道，但是ATi多项新技术的应用，使得在渲染管线上落后的ATi，在实际测试中并不落后nVIDIA，或者可以说：ATi的新技术大大提升了渲染管线的工作效率。

第4页：全新的像素渲染引擎Part I

其实，Radeon X1800的Vertex Shader和R420的Vertex Shader结构非常的相似，这点从架构图中就可以看出来，两者均为128位向量ALU搭配32位标量ALU的方式，每个周期内，每个Vertex Shader单元能够完成两条Vertex Shader指令，8个Vertex Shader单元在每个周期内一共能够完成 T&L里的Transformation（两个顶点的转换）——所以Radeon X1800GPU是目前第一款能够完成100亿条Vertex Shader指令的产品。

另外，Radeon X1800也同样加入了对Shader Model 3.0的支持，所以Vertex Shader也能够支持Vertex Shader 3.0，包括像分支、子程序、循环等动态流控制指令。每条Vertex Shader程序长度可以达到1024条指令，但我们可以讲程序的长度看成几乎是没有限制的，因为会搭配上动态流控制。

不过，在实现的方式上，ATi Radeon X1800和nVIDIA GeForce7800两款显卡的Shader Model 3.0上，是有些区别的。最明显的不同就是Radeon X1800不支持顶点纹理拾取（Vertex Texture Fetch），但顶点纹理拾取是Vertex Shader 3.0中必备的功能之一，所以ATi采取了一个折中的方案：Render To Vertex Buffer，这项技术的中文翻译是：渲染至顶点缓存，我们姑且称其为RTVB。虽然ATi拥有了这种折中的方案，但是这种方案和Vertex Texture Fetch相比，还是缺乏灵活性——Vertex Texture Fetch中的纹理在Vertex Shader内都是可以动态取样的，顶点的数据也可以实现动态变更，同样更加容易加入集合LOD，而RTVB的屋里数据如果要发生改变的话，整个渲染的过程也要随着变化而变动，效率会比较低下。

为了提升效率，ATi在Radeon X1000系列显卡的Pixel Shader上加入了超线程分派处理器（Ultra Threading Dispatch Processor）的概念。这项技术有点类似于Intel的超线程技术，具备了调度、控制逻辑的功能，最多能够同时处理512个并行线程。Ultra Threaded Pixel Shader引擎能够把一个庞大的Pixel Shader运算拆分为大量的小执行绪，然后平均分配给各个Pixel Shader单元。而执行绪又会被分割成许多的Pixel Blocks，因此，能够排除因部分Unit需要等待其他Unit所造成的Unit闲置，减少了不必要的延迟，大大的提升了执行效率。

posted on 2006-01-18 09:08 王大牛的幸福生活阅读(1540) 评论(1) 编辑收藏举报