第1页:显卡市场——没有硝烟的战场

现在能够在显卡市场上驰骋的,只有ATi和nVIDIA,虽然市场上依旧还有XGI和S3的身影,但这两家公司,并不是,也不能够引领显卡技术的发展。ATi和nVIDIA的竞争可以说已经日趋白热化——从8500 Vs Ti 500开始,ATi和nVIDIA每次“战争”之间间隔的时间越来越短,相反的,每次“战争”的则越来越激烈。

距离ATi和nVIDIA的上一次战争已经一年有余,在上一次的战争中,双方有输有赢——nVIDIA凭借NV40的出色表现,打败了R420,赢得了高端显卡之王的宝座;而ATi却凭借着Radeon 9550的风光,横扫中低端显卡市场,赚了大笔大笔的钞票。

两家显示巨头的竞争还在继续,时间进入了2005年,由于ATi和nVIDIA分别为Xbox360和PS3开发图形显示核心,所以两家公司、以及其显示核心的曝光率又提高了不少,对于Xbox360和PS3两款游戏机的图形显示核心的优劣,SONY迷们和Xbox粉丝各有不同的看法;同样的,DIYer对于nVIDIA和ATi面向桌面市场的产品也是充满了期待。

nVIDIA在今年的6月率先拿出了研发代号为G70的顶级显卡GeForce 7800GTX,拥有超强的性能和多项新技术,并且可超频性非常不错,但是,今天的主角不是GeForce 7800GTX,而是ATi的R520。

小贴士:关于GeForce 7800GTX的超频

小熊在线曾经在9月举办了DFI钻石杯Lanparty超频比赛,小熊的高手亦有参加,因为大家本身都是月光族,所以小熊高手使用的显卡,均为厂商送测的GeForce7800GTX,当时小熊一共有两块7800GTX,任何一块都可以稳定在500MHz的频率上,这对于高端卡来说,已经是比较不容易的——因为7800GTX当时全部都是公板设计,所以 就可以见解反映出:其他的GeForce 7800GTX的频率基本上可以轻松达到500MHz。

在经过了3次的Re-tape和多次跳票之后,ATi在今年的10月份拿出了Fans期待以久的Radeon X1000系列显卡,但仅仅是发布,在2个月后的今天,才逐渐有产品上市。

第2页:Radeon X1000系列产品线简介

和GeForce 7800系列有所不同,ATi一次性发布了Radeon X1000系列的产品。Radeon X1000系列一共分为高端Radeon X1800XT、XL;中端Radeon X1600XT、Pro和低端的Radeon X1300Pro、标准版、HyperMemeoy。面向高端、中端、低端的芯片,核心代号分别为R520、RV530和RV515,其中RV530和RV515均为R520的衍生产品。

作为ATi的高端产品,Radeon X1800系列拥有16条象素渲染管线和8个顶点渲染通道,而在象素渲染管线决定大部分性能的今天,Radeon X1800面对GeForce 7800GTX的24条管线和GeForce 7800GT的20条管线,还是有一定的差距的。于是ATi就利用了90纳米Low-K制造工艺能够实现高频率的优势,将Radeon X1800的核心频率设定到了625MHz,要比7800GTX高超过了45%;另外,Radeon X1800采用了1.5GHz的超高频率显存,在显存带宽的指标上,占据了一定的优势。而频率上的优势,则让Radeon X1800和7800GTX的竞争中不会处于劣势。

让人不解的是:虽然Radeon X1800只拥有16条渲染管线,可是依旧集成了3亿2000万个晶体管,比GeForce 7800GTX还要多出1800万,所以Radeon X1800是否拥有24管线的产品,还是一个谜。在制造工艺上,TMSC 0.09微米Low-K制造工艺能够有效的降低互连线之间的分布电容,并且避免寄生电容,使得频率可以有10%以上的提升。只是90纳米制造工艺在ATi身上应用的并不是十分顺利,ATi也因为这个原因,多次推迟了Radeon X1000系列的发布,当然,问题总是会解决的,Radeon X1000系列终于实现了量产,推向了市场。

Radeon X1600系列是X1000产品线中的中端产品,我们可以将其看成Radeon X1800的缩水版,Radeon X1600只有5个顶点渲染通道和12条象素渲染管线,核心集成了1亿5700万个晶体管,核心频率590MHz,并且搭配了1.38GHz的显存;不过Radeon X1600Pro的频率有明显的降低,分别只有500/780MHz,和XT的差距非常明显。

Radeon X1000系列的低端产品Radeon X1300只拥有4条象素渲染管线和2个顶点渲染引擎,分为Pro、标准版和HyperMemory版,其中Pro和标准版的核心频率为600MHz,显存频率800MHz,而HyperMemory的核心频率为450MHz,集成32MB显存,提供了共享系统内存作为显存的解决方案。为了弥补显存容量上的不足,HyperMemory版采用了频率高达1GHz的显存,大大提升了显存的性能。

虽然在硬件规格上有一些差别,但是Radeon X1000系列在架构上采用相同的架构,所以在功能特性方面,也都完全相同。例如超执行渲染引擎架构、完美支持SM 3.0的渲染单元等等。其中象素渲染部分被重新优化,引入多线程技术以提高效率;引入了双向内存读取环路技术来提高显存的利用效率,全相连的技术提高了Cache的命中率,并且通过改进的HyperZ压缩技术实现了显存的有效利用。

Radeon X1000通过HDR、Adaptive AA等技术,提高了3D影像的画质,并且同时保证了系统的性能,支持ATi独特的AVIVO技术,能够轻松完成HDTV影像的回放,帮助用户进行视频采集、编码、解码、格式转换等操作,其中大部分运算任务均为ATi VPU承担,可以明显的降低CPU的占有率。

第3页:Radeon X1000系列显卡技术解析

在为大家介绍Radeon X1000系列显卡的技术之前,我想先说说Radeon X1000系列产品的一些主要技术特性。

Radeon X1800的主要特性:

        Ultra Theareding Dispatch Processor有效的减少了空闲,提高了效率

        512bit Ring Bus Memory Controller架构,提高了显存带宽的利用率

        硬件支持Shader Model 3.0和HDR全速128bit渲染

        自适应反锯齿模式,在性能和画质之间选取一个平衡点,能够取得最好的效果。

        支持AVIVO影像处理技术,加速MPEG4解码

Radeon X1600的主要特性:

        支持Ultra Theareding Dispatch Processor引擎

        基于256bit Ring Bus Memory Controller架构

        支持Shader Model 3.0和HDR

        支持ATi自适应抗锯齿

        支持AVIVO影像处理技术

Radeon X1300的主要特性:

        支持Ultra Theareding Dispatch Processor引擎

        基于256bit Ring Bus Memory Controller架构

        支持Shader Model 3.0和HDR

        支持ATi自适应抗锯齿

        支持AVIVO影像处理技术

        支持ATi HpyerMemory技术

Radeon X1800作为ATi的新旗舰产品,采用了TMSC Low-K0.09微米制造工艺制造,内部集成了超过3.2亿个晶体管,要比其竞争对手nVIDIA GeForce 7800GTX还要多出1800万个,同时,其核心晶体管数目也是R480的两倍。

『 ATi Radeon X1800核心显微图 』

ATi Radeon X1800显示核心创造了目前显示芯片市场上的多个第一——第一款使用90nm制造工艺的显示核心、集成最多晶体管的显示核心、频率突破600MHz的显示核心。虽然ATi的Radeon X1800在几个非常重要的性能参数上都取得了领先,但制造工艺的不成熟,让ATi Radeon X1800显示核心中仅仅集成了16条象素渲染管线和8个顶点渲染通道,16条和GeForce 7800GTX的24条相差50%,和传闻中的32条渲染管线更是相差甚远。

虽然只有16条渲染管线和8个顶点渲染通道,但是ATi多项新技术的应用,使得在渲染管线上落后的ATi,在实际测试中并不落后nVIDIA,或者可以说:ATi的新技术大大提升了渲染管线的工作效率。

第4页:全新的像素渲染引擎Part I

其实,Radeon X1800的Vertex Shader和R420的Vertex Shader结构非常的相似,这点从架构图中就可以看出来,两者均为128位向量ALU搭配32位标量ALU的方式,每个周期内,每个Vertex Shader单元能够完成两条Vertex Shader指令,8个Vertex Shader单元在每个周期内一共能够完成 T&L里的Transformation(两个顶点的转换)——所以Radeon X1800GPU是目前第一款能够完成100亿条Vertex Shader指令的产品。

另外,Radeon X1800也同样加入了对Shader Model 3.0的支持,所以Vertex Shader也能够支持Vertex Shader 3.0,包括像分支、子程序、循环等动态流控制指令。每条Vertex Shader程序长度可以达到1024条指令,但我们可以讲程序的长度看成几乎是没有限制的,因为会搭配上动态流控制。

不过,在实现的方式上,ATi Radeon X1800和nVIDIA GeForce7800两款显卡的Shader Model 3.0上,是有些区别的。最明显的不同就是Radeon X1800不支持顶点纹理拾取(Vertex Texture Fetch),但顶点纹理拾取是Vertex Shader 3.0中必备的功能之一,所以ATi采取了一个折中的方案:Render To Vertex Buffer,这项技术的中文翻译是:渲染至顶点缓存,我们姑且称其为RTVB。虽然ATi拥有了这种折中的方案,但是这种方案和Vertex Texture Fetch相比,还是缺乏灵活性——Vertex Texture Fetch中的纹理在Vertex Shader内都是可以动态取样的,顶点的数据也可以实现动态变更,同样更加容易加入集合LOD,而RTVB的屋里数据如果要发生改变的话,整个渲染的过程也要随着变化而变动,效率会比较低下。

为了提升效率,ATi在Radeon X1000系列显卡的Pixel Shader上加入了超线程分派处理器(Ultra Threading Dispatch Processor)的概念。这项技术有点类似于Intel的超线程技术,具备了调度、控制逻辑的功能,最多能够同时处理512个并行线程。Ultra Threaded Pixel Shader引擎能够把一个庞大的Pixel Shader运算拆分为大量的小执行绪,然后平均分配给各个Pixel Shader单元。而执行绪又会被分割成许多的Pixel Blocks,因此,能够排除因部分Unit需要等待其他Unit所造成的Unit闲置,减少了不必要的延迟,大大的提升了执行效率。


posted on 2006-01-18 09:08  王大牛的幸福生活  阅读(1540)  评论(1编辑  收藏  举报