What is Fermi?(9)

 

纹理单元改进后的优势

 

纹理单元

另一个重要单元——纹理单元,在每个SM阵列当中均被安置了四个。每个纹理单元在一个时钟周期内能够计算一个纹理地址并获取四个纹理采样。返回的结果可以是经过过滤的也可以是未过滤的。支持的模式包括双线性、三线性以及各向异性过滤模式。

在GT200当中,每三个SM阵列才能够共享到一个纹理引擎,且此纹理引擎仅有8个纹理单元。而在GF100当中,每个SM阵列当中均由一个属于自己的纹理引擎,包含四个纹理单元,并且还配有专用的纹理高速缓存。另外,纹理单元的运行速度也不再与核心频率同步,而是设计在更高的频率上(是否与Shader频率相同NVIDIA并没有表明,但是概率很高)这样的设计将会对阴影贴图以及环境光遮蔽等效果起到很大帮助。

TexturePR LiveWriter/WhatisFermi9_E1F6/TexturePR_thumb.jpg" width="496" border="0" /> 

另外,在GF100当中加入的大容量L1及L2缓存也可以被纹理单元所调用,并且针对纹理单元进行优化,实现了三倍于GT200的容量。

针对DX11方面的改进当中,GF100的纹理单元还加入了BC6H与BC7H纹理压缩格式的支持,这两种纹理压缩格式将会大幅减少在HDR效果下纹理与渲染器目标的缓存占用空间。

Sampling

另外,纹理单元通过DirectX 11的四偏置点(Four-offset)Gather4特性,还支持抖动采样。这样一来,单一纹理指令就能够从一个128×128的像素网格中获取四个纹理像素。GF100在硬件上采用了DirectX 11四偏置点Gather4,大大加快了阴影贴图、环境光遮挡以及后期处理算法的速度。

posted @ 2010-04-22 16:11  芈希有  阅读(207)  评论(0编辑  收藏  举报