LCD 基础知识篇3

back porch

中文含义为“后沿”，它是NTSC复合视频信号中位于行消隐间隔内的一个4.7毫秒的区域，它包含了一个8到10个周期的3.579545 MHz (3.58 MHz) 色彩副载波（color subcarrier）的突发。后沿占据了整个水平线时间的7%。它起始于水平线同步信号的结束处，并终止于视频的起始处。

TLB的基本概念：

TLB：Translation lookaside buffer,即旁路转换缓冲，或称为页表缓冲；里面存放的是一些页表文件（虚拟地址到物理地址的转换表）。

X86保护模式下的寻址方式：段式逻辑地址—〉线形地址—〉页式地址；

页式地址=页面起始地址+业内偏移地址；

对应于虚拟地址：叫page（页面）；对应于物理地址：叫frame（页框）；

X86体系的系统内存里存放了两级页表，第一级页表称为页目录，第二级称为页表。

TLB和CPU里的一级、二级缓存之间不存在本质的区别，只不过前者缓存页表数据，而后两个缓存实际数据。

二：内部组成：

1：TLB在X86体系的CPU里的实际应用最早是从Intel的486CPU开始的，在X86体系的CPU里边，一般都设有如下4组TLB:

第一组：缓存一般页表（4K字节页面）的指令页表缓存（Instruction-TLB）；

第二组：缓存一般页表（4K字节页面）的数据页表缓存（Data-TLB）；

第三组：缓存大尺寸页表（2M/4M字节页面）的指令页表缓存（Instruction-TLB）；

第四组：缓存大尺寸页表（2M/4M字节页面）的数据页表缓存（Data-TLB）；

2：TLB命中和TLB失败

果 TLB中正好存放着所需的页表，则称为TLB命中（TLB Hit）；如果TLB中没有所需的页表，则称为TLB失败（TLB Miss）。

3：TLB条目数

即页表条目数，Entry!

4：TLB的联合方式

1〉全联合方式：Athlon XP

2〉4路联合方式：P4

当CPU执行机构收到应用程序发来的虚拟地址后，首先到TLB中查找相应的页表数据，如果TLB中正好存放着所需的页表，则称为TLB命中（TLB Hit）,接下来CPU再依次看TLB中页表所对应的物理内存地址中的数据是不是已经在一级、二级缓存里了，若没有则到内存中取相应地址所存放的数据。既然说TLB是内存里存放的页表的缓存，那么它里边存放的数据实际上和内存页表区的数据是一致的，在内存的页表区里，每一条记录虚拟页面和物理页框对应关系的记录称之为一个页表条目（Entry），同样地，在TLB里边也缓存了同样大小的页表条目（Entry）。

CPU的英文全称是Central Processing Unit，即中央处理器。CPU被设计成可以传送各种程序，数据和指令。当处理某条指令所需的数据目前无法得到时，处理器会暂时把该指令放置在一旁等候相应的处理数据，而同时继续执行其它的程序指令。因此，CPU的速度是按照整个数据的吞吐量来确定的。
什么是CPU
　　CPU是英语“Central Processing Unit/中央处理器”的缩写，CPU一般由逻辑运算单元、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器，这些寄存器用于CPU在处理数据过程中数据的暂时保存。
　　CPU主要的性能指标有：
主频
　　即CPU的时钟频率(CPU Clock Speed)，这是我们最关心的，我们所说的233、300等就是指它，一般说来，主频越高，CPU的速度就越快，整机的就越高。
时钟频率
　　即CPU的外部时钟频率，由电脑主板提供，以前一般是66MHz，也有主板支持75和83MHz，目前Intel公司最新的芯片组BX已使用100MHz的时钟频率。另外VIA公司的MVP3、MVP4等一些非Intel的芯片组也开始支持100MHz的外频。精英公司的BX主板甚至可以支持133MHz的外频，这对于超频者来是首选的。
内部缓存（L1 Cache）
　　封闭在CPU芯片内部的高速缓存，用于暂时存储CPU运算时的部分指令和数据，存取速度与CPU主频一致，L1缓存的容量单位一般为KB。L1缓存越大，CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少，相对电脑的运算速度可以提高。
外部缓存（L2 Cache）
　　CPU外部的高速缓存，Pentium Pro处理器的L2和CPU运行在相同频率下的，但成本昂贵，所以Pentium II运行在相当于CPU频率一半下的，容量为512K。为降低成本Inter公司生产了一种不带L2的CPU命为赛扬，性能也不错，是超频的理想。现在的CPU已经全部内置，而且是全速，也就是等于CPU的频率，赛扬3的L2缓存就与CPU同频。
MMX技术
　　是“多媒体扩展指令集”的缩写。MMX是Intel公司在1996年为增强Pentium CPU在音像、图形和通信应用方面而采取的新技术。为CPU增加57条MMX指令，除了指令集中增加MMX指令外，还将CPU芯片内的L1缓存由原来的16KB增加到32KB（16K指命+16K数据），因此MMX CPU比普通CPU在运行含有MMX指令的程序时，处理多媒体的能力上提高了60％左右。目前CPU基本都具备MMX技术，除P55C和Pentium ⅡCPU还有K6、K6 3D、MII等。
制造工艺
　　现在CPU的制造工艺是0.18微米，在将来的CPU制造工艺可以达到0.15微米甚至更低。
CPU术语概览
　很多人在阅读电脑文章时经常会被文章里的一些英文名词所难倒，为此特意整理了一些有关cpu的名词给大家。
BGA：Ball Grid Array，球状矩阵排列 CMOS: Complementary Metal Oxide Semiconductor，互补金属氧化物半导体 CISC：Complex Instruction Set Computing，复杂指令集计算机 COB：Cache on board，板上集成缓存 COD：Cache on Die，芯片内集成缓存 CPGA：Ceramic Pin Grid Array，陶瓷针型栅格阵列 CPU：Center Processing Unit，中央处理器 EC：Embedded Controller，微型控制器 FEMMS：Fast Entry/Exit Multimedia State，快速进入/退出多媒体状态 FIFO：First Input First Output，先入先出队列 FPU：Float Point Unit，浮点运算单元 HL-PBGA: 表面黏著,高耐热、轻薄型塑胶球状矩阵封装 IA：Intel Architecture，英特尔架构 ID：identify，鉴别号码 IMM: Intel Mobile Module, 英特尔移动模块 KNI：Katmai New Instructions，Katmai新指令集，即MMX2 MMX：MultiMedia Extensions，多媒体扩展指令集 NI：Non－Intel，非英特尔 PGA: Pin-Grid Array：引脚网格阵列,耗电大 PSN：Processor Serial numbers，处理器序列号 PIB: Processor In a Box：盒装处理器 PPGA：Plastic Pin Grid Array，塑胶针状矩阵封装 PQFP：Plastic Quad Flat Package RISC：Reduced Instruction Set Computing，精简指令集计算机 SEC: Single Edge Connector，单边连接器 SIMD：Single Instruction Multiple Data，单指令多数据流 SiO2F：Fluorided Silicon Oxide，二氧氟化硅 SOI: Silicon-on-insulator，绝缘体硅片 SSE：Streaming SIMD Extensions，单一指令多数据流扩充 TCP: Tape Carrier Package：薄膜封装,发热小 TLBs：Translate Look side Buffers，翻译旁视缓冲器 VLIW：Very Long Instruction Word，超长指令字 WHQL: Microsoft Windows Hardware Quality Lab,微软公司视窗硬件质量实验室
CPU基础篇
一、CPU类别概述
　　1978年，美国Intel公司首次生产出16位的微处理器，并命名为i8086。这款产品使用的指令集人们称之为x86指令集。以后，Intel陆续生产出更先进和更快速的新型CPU，这些新型的CPU都兼容原来的x86指令集，被称为“x86系列CPU”。从1978年Intel制造出第一颗i8086以来的短短二十年，Intel CPU已经发展到第六代的Pentium Ⅲ处理器，并且64位的第七代处理器也即将推出。
　　目前主流CPU从封装形式来看主要分为两大类——一种是传统针脚式的Socket类型，另一种是插卡式的Slot类型，以下就让我们来看看它们之间的区别。
　　1、Socket 7
　　PC机从386开始普遍采用Socket插座来安装CPU，从Socket 4、Socket 5一直延续到现在最为普及的Socket 7。
　　　
　　Socket 7是方形多针脚ZIF（零插拔力）插座，插座上有一根拉杆，在安装和更换CPU时只要将拉杆向上拉出，就可以轻易地插进或取出CPU芯片了。Socket 7插座不但可以安装Intel公司的Pentium、Pentium MMX，还能安装AMD公司的K5、K6和K6-2；Cyrix公司的6x86、6x86MX、MⅡ；IDT公司的Winchip C6等，适用范围非常广。Socket 7也是CPU进入“奔腾”时代后，最常见的主板构架，一般采用Intel的HX、TX等芯片组，主要特点是——具有66MHz的标准外频（最高83MHz）、一般提供双电压供电机制、有多个PCI及ISA插槽用以支持PCI及ISA接口设备、VX、TX等芯片组还支持168线的SDRAM。Socket 7系列具有代表性的CPU产品有：
　　2、Super 7
　　这应该算是Socket 7系列的升级版本。一般采用MVP3、Aladdin Ⅴ等非Intel芯片组，与Socket 7相比主要有两点改进——将总线频率提高到100MHz（最高到133MHz）以上，提供了AGP插槽，可以使用AGP显卡。兼容Socket 7所支持的所有CPU，目前主要与AMD的K6-2、K6-3配合，构成价廉物美的高性价比PC。K6-2仍然采用Socket 7插座式封装，但支持100MHz的外频，最新上市的K6-3也运行在Super 7构架的主板上。
　　3、Slot 1
　　与Socket 7相比，Slot 1是完全不同的CPU插槽。Slot 1是一个狭长的242引脚的插槽，与采用SEC（单边接触）封装技术制造的Pentium Ⅱ处理器紧密吻合。除CPU插槽有较大差异外，Slot 1架构的主要特点与Super 7非常相近。Intel的440BX芯片组是专为支持100MHz以上外频而设计的，并对AGP技术提供了完善的支持。Slot 1是目前主板的主流架构，所适应的CPU有Intel的Pentium Ⅱ、Pentium Ⅲ、Celeron及Celeron A系列CPU。
　　Slot 2与Slot 1基本类似，是应用于高端服务器的一种接口，在Intel 440GX或440NX芯片组的配合下与Intel的高端产品Xeon处理器配合。
　　4、Slot A
　　AMD K7所用的Slot接口被称为“Slot A”，从外观上看，Slot A接口与Intel的Slot 1接口完全相同，但两者在电气性能上完全不兼容，为K7所设计的芯片组或主板将不能使用Intel的CPU。AMD称，按照这个设计，生产厂家仍然可以从现有市场上得到所有所需的原材料部件。
　　5、Socket 370系列
　　这是Intel在低价电脑风潮逼迫下吃的“回头草”。Intel曾一度希望其拥有专利保护的Slot 1架构能拉开AMD和Cyrix的差距，从而独享CPU市场，但事实上却反而为对手创造了生存空间。新型的Celeron处理器具有370条针状引线，与296针的Socket 7插座不兼容。咋一看，它的外形与Intel的MMX“黑金刚 ”非常相似，但它们并不完全相同，因为集成二级Cache的缘故，Socket 370的赛扬处理器要大些。通过转换卡，Socket 370 CPU也可以安装在具有Slot 1插槽的主板上。
二、CPU技术一览
　　1、指令集之争
　　近年来，在CPU新技术发展中，最引人瞩目的就是指令集的不断推陈出新。为增强计算机在多媒体、3D图像等方面的应用能力而产生了MMX、3DNow!、SSE等新指令集。　　　
　　MMX技术
　　首先，MMX技术一次能处理多个数据。计算机的多媒体处理，通常是指动画再生、图像加工和声音合成等处理。在多媒体处理中，对于连续的数据必须进行多次反复的相同处理。利用传统的指令集，无论是多小的数据，一次也只能处理一个数据，因此耗费时间较长。为了解决这一问题，在MMX中采用了SIMD（单指令多数据技术），可对一条命令多个数据进行同时处理，它可以一次处理64bit任意分割的数据。其次，是数据可按最大值取齐。MMX的另一个特征是在计算结果超过实际处理能力的时候也能进行正常处理。若用传统的x86指令，计算结果一旦超出了CPU处理数据的限度，数据就要被截掉，而化成较小的数。而MMX利用所谓“饱和（Saturation）”功能，圆满地解决了这个问题。计算结果一旦超过了数据大小的限度，就能在可处理范围内自动变换成最大值。
　　3DNow!技术
　　AMD在K6-2中一炮打响的3DNow！技术实际上是指一组机器码级的扩展指令集（共21条指令）。这些指令仍然以SIMD（单指令多数据）的方式实现一些浮点运算、整数运算、数据预取等功能。而这些运算类型（尤其是浮点运算）是从成百上千种运算类型中精选出来的在3D处理中最常用的。3DNow！似乎与MMX同出一辙，但是二者的用途不完全相同。MMX侧重于整数运算，因而主要针对图形描绘、数据压缩与解压缩、音频处理等应用场合，而3DNow！侧重的是浮点运算，因而主要针对三维建模、坐标变换、效果渲染等三维应用场合。3DNow！指令不仅以SIMD方式运行，而且可在两个暂存器的执行通道内以一个时钟周期同时执行两个3DNow！指令的方式运行，即每个时钟周期可执行四个浮点运算，这就是AMD K6-2能大幅提高3D处理性能的原因。
　　SEE指令
　　面对AMD 3DNow！技术的挑战，Intel在最新的Pentium Ⅲ处理器中添加了70条新的SSE（KNI）指令，以增强三维和浮点运算能力，并让原来支持MMX的软件运行得更快。SSE指令可以兼容以前的所有的MMX指令，新指令还包括浮点数据类型的SIMD，CPU会并行处理指令，因而在软件重复做某项工作时可以发挥很大的优势。
　　与之相比，MMX所提供的SIMD仅对整数类型有效。众所周知，三维应用与浮点运算的关系很密切，强化了浮点运算即是加快了三维处理能力，在进行变换3D坐标（特别是同时变换几个）工作时，SIMD会在一秒钟内做出更多的操作，所以利用SIMD浮点指令将得到更高的性能，它能进一步加强对场景做渲染、实时影子效果、倒映之类的工作。对于用户来说，这意味着3D物体更生动，表面更光滑，“虚拟现实”更“现实”。
　　SSE指令可以说是将Intel的MMX和AMD的3DNow！技术相结合的产物，由于3DNow!使用的是浮点寄存方式，因而无法较好地同步进行正常的浮点运算。而SSE使用了分离的指令寄存器，从而可以全速运行，保证了与浮点运算的并行性。尤其是两者所使用的寄存器差异颇大——3DNow！是64位，而SSE是128位。
　　此外Katmai处理器还有一个新的特性——“内存流”，它和3DNow！的Prefetch指令十分相似，作用是在数据被使用之前把它们上传到一级缓存。不同之处在于Katmai可以选择从所有Cache中取得缓存数据，不只是从L2 Cache中取得缓存数据，因此SSE将比3DNow!更快。
　　3DNow！和SSE虽然彼此并不兼容，但它们却很相似。究其实质，都试图通过单指令多数据（SIMD）技术来提高CPU的浮点运算能力；它们都支持在一个时钟周期内同时对多个浮点数据进行处理；都有支持如像MPEG解码之类专用运算的多媒体指令。
　　2、高速缓存（Cache）技术的发展
　　所谓高速缓存，顾名思义，就是可以进行快速存取数据的存储器，它使得数据可以更快地和CPU进行交换，在速度上较主存储器更为优胜。处理器首先从位于片内的缓存（称为L1 Cache）中查找数据，如果在L1 Cache中未找到，处理器将会到系统的主内存中查找。假设存在L2 Cache，处理器就可以在L2 Cache中查找而不必直接到主内存中查找，因此从理论上讲系统拥有的L2 Cache越多，处理器直接访问速度较慢的主内存的机会就会越少。
　　在AMD最新的K6-3处理器中采用了三级Cache技术（TriLevel Cache），使得整机的性能有较大的提高。K6-3在内部集成了256KB的L2 Cache。一直以来，个人电脑都采用两级Cache结构，内置于片内的缓存称为L1 Cache，而L2 Cache可以外置于主板上，也可以内置于处理器芯片中（如PⅡ、Celeron 300A）。以前的K6-2虽然主频可以从300MHz提高到450MHz，但同PⅡ相比，其L2 Cache却仅能以100MHz的频率运行，所以性能提高不大。K6-3内置的L2 Cache在核心频率下工作，完全不受外部总线的限制。
　　在K6-3中采用的三级高速缓存包括一个全速64KB L1 Cache、一个内部全速256KB L2 Cache、运行在100MHz外部总线的Super7主板上可选外部L3 Cache。这样，其处理速度较同频的Intel Pentium Ⅱ快一个速度等级，不但提高缓存容量，而且提供更高的带宽。以前的100MHz外频外置式Cache支持800Mbps的带宽，而以450MHz运行的内置式二级缓存可支持3600Mbps的带宽，由于采用可同时读写操作的双端口设立，总带宽提高到7200Mbps，较100MHz的外置式Cache带宽提高九倍。原来Super 7主板上的L2 Cache自然成为三级缓存，容量从512KB～2MB，运行在100MHz外频下，其与L1、L2的强劲组合把处理器的性能发挥到了极限。
　　3、更先进的制造工艺
　　AMD为了跟Intel继续争夺下个世纪的微处理器市场，已经跟摩托罗拉（Motorola）达成一项长达七年的技术合作协议。Motorola将把最新开发的铜导线工艺技术(Copper Interconnect)授权给AMD。AMD准备在2000年之内，制造高达1000MHz(1GHz)的K7微处理器。
　　CPU将向速度更快、64位结构方向前进。CPU的制作工艺将更加精细，将会由现在0.25微米向0.18微米过渡。到2000年时，大部分CPU厂商都将采用0.18微米工艺制造处理器，2001年之后，许多厂商都将转向0.13微米的铜制造工艺。制造工艺的提高，味着体积更小，集成度更高，耗电更少。
　　铜技术的优势非常明显，主要表现在以下方面——铜的导电性能优于现在普遍应用的铝，而且铜的电阻小，发热量小，从而可以保证处理器在更大范围内的可靠性；采用0.13微米以下及铜工艺芯片制造技术将有效地提高处理器的工作频率；能减小现有管芯的体积。与传统的铝工艺技术相比，铜工艺制造芯片技术将有效地提高处理器的速度，减小处理器的面积，从发展来看铜工艺将最终取代铝工艺。
CPU的里里外外
　　CPU是中央处理单元(Central Processing Unit)的缩写，它可以被简称做微处理器(Microprocessor)，不过经常被人们直接称为处理器(Processor)。不要因为这些简称而忽视它的作用，CPU是计算机的核心，其重要性好比心脏对于人一样。实际上，处理器的作用和大脑更相似，因为它负责处理、运算计算机内部的所有数据，而主板芯片组则更像是心脏，它控制着数据的交换。CPU的种类决定了你使用的操作系统和相应的软件，CPU的速度决定了你的计算机有多强大，当然越快、越新的CPU会花掉你更多的钱。

　　如今，Intel的CPU和其兼容产品统治着微型计算机——PC的大半江山，所以《CPU演义》系列文章将着重介绍这些CPU以及有关它们的制造过程、运行方式、性能、种类等知识。
　　无论是Intel或AMD的CPU，还是你可能听说过的其他一些CPU(比如iMac或SGI工作站所使用的CPU)，它们都有很多的相似之处。
　　CPU的核心
　　从外表看来，CPU常常是矩形或正方形的块状物，通过密密麻麻的众多管脚与主板相连。不过，你看到的不过是CPU的外衣——CPU的封装。而内部，CPU的核心是一片大小通常不到1/4英寸的薄薄的硅晶片(其英文名称为die，核心)。在这块小小的硅片上，密布着数以百万计的晶体管，它们好像大脑的神经元，相互配合协调，完成着各种复杂的运算和操作。
　　硅能成为生产CPU核心的半导体材料主要是因为其分布的广泛性和价格便宜。此外，硅可以形成品质极佳的大块晶体，通过切割，得到直径8英寸甚至更大而厚度不足1毫米的圆形薄片——晶片(也叫晶圆)。一片晶片可以划分切割成许多小片，每一小片就是一块单独CPU的核心。当然，在切割之前有许多处理过程要做。
　　Intel发布的第一颗处理器4004仅仅包含2000个晶体管，而目前最新的PⅢ处理器包含超过2000万个晶体管，集成度提高了上万倍，这可以说是当今最复杂的集成电路了。与此同时，你会发现单个CPU的核心硅片的大小丝毫没有增大，甚至变得更小了，这就要求不断地改进制造工艺以便能生产出更精细的电路结构。如今，最新的处理器采用的是0.18微米技术制造，也就是常说的0.18微米线宽。
　　需要说明的是，线宽是指芯片上的最基本功能单元——门电路的宽度，因为实际上门电路之间连线的宽度同门电路的宽度相同，所以线宽可以描述制造工艺。缩小线宽意味着晶体管可以做得更小、更密集，可以降低芯片功耗，系统更稳定，CPU得以运行在更高的频率下，而且在相同的芯片复杂程度下可使用更小的晶圆，于是成本降低了。
　　随着线宽的不断降低，以往芯片内部使用的铝连线的导电性能将不敷使用，未来的处理器将采用导电特性更好的铜连线，AMD在刚刚推出的K7系列的新成员——Thunderbird(雷鸟)的高频率版本中已经开始采用铜连线技术。
　　CPU的封装
　　在通过了几次严格的测试以后，已经置备出各种电路结构的硅片就可以送封装厂进行切割，划分成单个处理器的die并置入到封装中。封装可不仅仅是件漂亮的外衣。由于有封装的保护，处理器核心与空气隔离可以避免污染物的侵害。除此以外，良好的封装设计还有助于芯片散热。同时，它是连接处理器和主板的桥梁。
　　封装技术也在不断发展，目前最常见的是PGA(Pin－Grid Array，针栅阵列)封装，通常这种封装是正方形的，在中央区周围均匀的分布着三～四排甚至更多排引脚，引脚能插入主板CPU插座上对应的插孔。随着CPU总线宽度增加、功能增强，CPU的引脚数目也不断增多，同时对散热、电气特性也有更高的要求，演化出了SPGA(Staggered Pin－Grid Array，交错针栅阵列)，PPGA(Plastic Pin－Grid Array，塑料针栅阵列)。
　　奔腾ⅢCoppermine采用了一种独特的FC－PGA(Flip Chip Pin－Grid Array，反转芯片针栅阵列)封装，见图3。它把以往“倒挂”在封装基片下的核心翻转180度，稳坐于封装基片之上，这样可以缩短连线，并有利散热。不过这并非Intel的什么创世之举，当年AMD在K6处理器中就采用了类似的技术(是从IBM买的专利)，只不过由于被一块金属上盖“掩护”起来而不为人知,新Socket A系列CPU也采用的是类似技术。
　　CPU的接口
　　对应于不同架构的CPU，与主板连接的接口类型常各不相同。
　　586时代最常见的是Socket 7插座，如图4。它是方形多针角零插拔力插座，插座上有一根拉杆，在安装和更换CPU时只要将拉杆向上拉出，就可以轻易地插进或取出CPU芯片了。Socket 7插座适用于Intel Pentium、Pentium MMX、AMD K5、K6、K6－2、K6－Ⅲ、Cyrix 6X86、X86 MX、MⅡ等处理器。
　　Socket 370插座和Socket 7插座的外形差不多，只不过它有370个孔，主要适用于Intel Celeron、Coppermine及VIA CyrixⅢ系列处理器。
　　Slot 1插槽Intel的专利技术，它是一个狭长的242引脚的插槽，可以支持采用SEC(Single－Edge connector,单边连接器)封装技术的PentiumⅡ、PentiumⅢ和Celeron处理器。Intel首创的SEC封装实际上是一个固定在子卡上的PGA封装
　　Slot A架构是由Intel的竞争对手AMD提出的，它支持AMD Athlon处理器。从外观看，Slot A与Slot 1一样，不过它们在主板上的安装完全反向，电气指标也完全不同，不可以混淆的。
　　目前看来，无论是Intel还是AMD都重新垂青于Socket架构，AMD Athlon家族新成员Duron和Thunderbird都采用了Socket A接口。尽管Slot架构对于Intel高端的至强(Xeon)处理器还是首选，但在未来还有多大空间却是未知。
CPU产品篇
一、Socket系列CPU
　　1、AMD K6-3
　　K6-3的代号是Sharptooth，中文译名为“利齿”。
　　相对于K6-2而言，K6-3的浮点单元和3DNow！指令集都未有改变，最大的变化就是内部集成了256KB二级缓存，且支持主板上的三级缓存。K6-3的这一变化将能够更大限度地发挥高主频的优势，K6-2的主频虽然可以从300MHz提高到450MHz，但由于二级缓存仅以100MHz频率运行，所以总体性能提高不大。而同样是从300MHz提高到450MHz，K6-3的二级缓存却能有50%的性能提升。K6-3还为我们提供了简便的升级方式，Super 7主板用户仅需对原主板的BIOS进行简单升级就能支持K6-3。
　　2、Rise mP6、mP6 Ⅱ
　　Rise公司所推出的mP6，是世界上第六个兼容x86指令的第六代处理器。mP6的节电设计以及多媒体加速性能引人瞩目，宣称其“多媒体执行性能”可以跟266MHz的Pentium Ⅱ系统打平；在节电设计方面，mP6会将暂时没执行到或用不到的线路（如浮点单元）自动关闭，使用时再自动开启。这两项特点，将会是mP6角逐低价位多媒体笔记型电脑的本钱。
　　随后Rise会推出第二代mP6(mP6 Ⅱ)，它将直接在芯片中内置256KB高速L2 Cache，其架构、定位非常类似于AMD推出的K6-3，Rise还宣称它将内置SSE或者是3DNow！指令集。
　　3、IDT WinChip C6
　　IDT WinChip C6由集成设备技术公司（Integrated Device Technology，IDT）开发，是一个单流水线，非超标量设计的芯片，但通过利用Pentium总线和更多的内部缓存，以及优秀的管线设计，使其基本可以达到Pentium级CPU的性能。它有64KB的内部缓存，与Pentium处理器管脚兼容，而且支持MMX技术。它的内核尺寸很小，只有8.8平方毫米，使用3.3V单电压，IDT的增强型芯片——WinChip3使用新的内核和超级流水线技术，主频为266MHz，使用0.25微米工艺制造，内核面积约7.5平方毫米。而即将推出的WinChip4，将拥有128KB一级缓存，芯片主频为400～700MHz，芯片功率为16W(2.5V)，还具备多达11个进程管道；使用了动态逻辑芯片；指令优化功能，适合高频率芯片而且不会浪费处理器的计算时间；可做智能预测、写入分配、合并和动态锁定等技术，其性能会有很大的提高。
　　4、AMD K6-2
　 K6-2采用0.25微米技术生产，其总线时钟提升至100MHz。相应地，其L2 Cache的时钟频率也提至100MHz。3DNow！技术是AMD K6-2最重要的特性，具备超标量MMX功能，有双重译码及双重执行通道，无译码配对限制。这些大大改善了MMX应用程序的运行性能。K6-2的核心部分维持了和前一代K6一样的设计，最大的不同是加入了3DNow!指令集，可以加速3D、CAD、DVD与多媒体的程序运算。由于物美价廉，获得不少使用者的好评，而且有许多软件商开始对3DNow！做优化，包括DVD播放程序、显卡驱动程序和3D游戏等。
　　5、Cyrix MⅡ
　　MⅡ采用0.35微米工艺制造，CPU电压为3.3V外频/2.9V内核，浮点性能较差，但具备很好的整数运算能力，而且价格非常便宜，一度成为“廉价PC”的开路先锋。可惜Cyrix已暂时退出了x86 CPU市场，不然在今年我们还可以看到其具备高性能和高集成度的“墨西哥红辣椒”——Jalapeno。
　　6、Cyrix Media GX
　　Media GX是Cyrix针对低端PC市场推出的一款廉价CPU，其中带MMX功能的称为GXm。Media GX需要与Cyrix CX55xx芯片组配合使用，因此，我们在市面上可以买到的Media GX都已集成在主板上，这种主板一般称为GX板。此外，某些GX板还集成了声效芯片和显示芯片。
　　7、Pentium MMX
　　这是一款里程碑式的经典CPU。Intel的MMX技术不仅仅使用了57条新的多媒体指令，事实上使芯片的性能得到了全面提升。它采用了0.35微米工艺制造，处理器核心的运行电压更低，发热量更小。Pentium MMX的出现使得CPU市场开始出现了“指令集”之争。
二、Slot系列CPU
　　1、Pentium Ⅲ
　　Pentium Ⅲ仍是32位Intel结构（IA-32）CPU，它最重要的技术特点在于采用了SSE（KNI）指令，以增强三维和浮点运算能力，此外Pentium Ⅲ处理器设计时便考虑了互联网的应用。它的另一个特色便是处理器包含了序列号，每个Pentium Ⅲ处理器都一个特定的号码，Intel认为这给用户带来的好处是可以提高互联网上的安全性。这个全新的64位处理器序列号，就相当于电脑的“身份证”，用户既可以用它对电脑进行认证，也可以在商务往来或是上互联网时用它进行加密，以提高电脑应用的保密性。
　　2、AMD K7
　　K7是目前业界关注的热点产品。它不兼容于Intel的Slot 1或Slot 2架构，使用的也不是Intel的P6GTL+总线协议，而是Digital公司的Alpha总线协议——EV6。EV6架构比目前Intel所有的架构都先进，它采用多线程处理的点到点拓扑结构，支持200MHz的总线频率。可以发挥下一代高速内存如Rambus的DirectRDRAM及DDR SDRAM的优点。
　　K7将拥有不低于128KB的L1 Cache（64KB数据和64KB指令），而Pentium Ⅱ仅有32KB。K7将带有Intel P6结构所采用的后援式总线的L2 Cache。L2 Cache的速度将从CPU主频的1/3直到全速，使用普通的SRAM或者DDR SRAM。灵活的L2 Cache设计使得AMD可以像Intel一样，通过L2 Cache的大小和速度来决定CPU的用途是工作站还是服务器。
　　K7采用0.25微米工艺制造，起码可以运行在500MHz。K7的FPU性能将超过Intel的PⅢ CPU，并提供完全平行的3路乱序FPU运算单元，非Intel CPU在FPU性能上的弱势将成为历史。K7将比Intel的CPU更快地运行CAD或者图形处理软件。在微结构方面，K7采用三条平行的x86指令译码器将x86指令翻译成定长的微指令，使得K7有72个指令控制单元。每条微指令可以执行1到2个操作。
　　K7也将是AMD的第一个具有SMP能力的桌面系统CPU——这意味着使用者将能够用K7构建双处理器甚至多处理器系统！
　　3、Pentium Ⅱ
　　毫无疑问，Pentium Ⅱ仍是目前CPU市场上的主力军。这也是Intel在冒险抛弃Socket市场后在Slot市场的第一款产品，好在这也是一款做得很成功的产品，它使Intel继续保持了在CPU市场上的优势。Pentium Ⅱ的核心其实就是Pentium Pro+MMX。传统Pentium Ⅱ是以SECC(Single Edge Contact Cartridge)的塑胶外框包装，而内部的电路板有BSRAM芯片、Cache控制器以及CPU核心芯片，CPU核心芯片采用PLGA(Plastic Land Grid Array)的封装方式，芯片外围垫着一块厚厚的塑胶板，而且只能单面能做接点焊接。新包装的Pentium Ⅱ采用了一种称为OLGA(Organic Land GridArray)的封装技术。
　　4、Celeorn（赛扬）
　　赛扬的定位是基于影响越来越大的“基本PC”，最初的两款产品没有L2 Cache，连封装盒也省掉了，走低价格低性能的路线，但未获成功。而Intel稍后推出的赛扬A，具有和目前奔腾二代处理器同等的内核，内置了128K全速L2 Cache（与CPU同频工作），更快的L2 Cache对系统降低沉重的数据负荷大有好处。而且同样拥有源于Intel Pentium Pro的D.I.B技术。Intel的赛扬系列是Intel面向低端市场的产品，其实就是PⅡ的简化版，唯一的差别在于减少了集成的L2 Cache。为了进一步降低成本，Intel又将原来Slot 1接口的赛扬A做成了Socket 370接口的PPGA封装。今后的赛扬系列处理器都将用PPGA封装。如果你的主板是Slot 1接口的，还可通过转接板来转换。
　　5、Xeon
　　Xeon是面向工作站和服务器市场的处理器，其设计目的是让它代替高能奔腾（Pentium Pro）级的产品。Xeon的核心和Pentium Ⅱ差不多。Xeon最大的改变在L2 Cache——Xeon最大可配备2MB L2 Cache并运行在CPU核心频率下。这些缓存芯片是Intel自己生产的，它和Pentium Ⅱ所用的芯片不同，被称为CSRAM（Custom StaticRAM，定制静态存储器），L2 Cache速度的提升让Xeon在许多场合下都比Pentium Ⅱ快，除此之外，它还有几项特别的东西——具有高能奔腾的所有特性；支持八个CPU系统（与450NX芯片组配合）；使用36位内存地址和PSE模式（PSE36模式）；最大800MB/s的内存带宽。
　　Xeon并不适合大多数人，它只是为多处理和多线性程序设计的，它能把工作站的性能提高约15%。如果你正打算购买一台工作站，选择Xeon是毫无疑问的。
　　6、Merced
　　Merced处理器预计将在2000年下半年推出，以0.18微米工艺制造。Merced预计将采用三阶段Cache架构，其中它有一个Level-0 Cache（L0 Cache）的概念，这个L0 Cache是设计成紧接在执行单元（execution unit）的高速缓存架构。据笔者猜想，它对IA32/IA64程序码加速作用不大，但是对内部微程序码的解码有顺畅甚至加速的作用；而紧接着CPU主芯片晶圆背部的就是L1 Cache，预计将会具有64～128KB的容量。
　　Merced的CPU主芯片与L2 Cache的架构配置仍旧是采取目前Pentium Ⅱ、Xeon的格式，L2 Cache是跟晶圆电路分离的，并且跟CPU晶圆一起封装成一个微处理器模块，外接的L2 Cache容量将有512KB、1MB到2MB可选，并且不排除有更高L2 Cache设计的可能。
CPU是怎么制造出来的
　　CPU发展至今已经有二十多年的历史，其中制造CPU的工艺技术也经过了长足的发展。下面简述CPU的制造过程：
　　第一步，取出一张利用激光器刚刚从硅柱上切割下来的硅片，它的直径越大可以切割的CPU就越多，生产成本就越低，这就是半导体加工厂为什么千方百计要提高晶圆直径的原因，现在工艺先进的半导体加工厂已经把晶圆的直径提高到了12英寸。
　　接着就是硅片镀膜了，在硅片表面增加一层由二氧化硅(SiO2)构成的绝缘层，随后就是镀胶，光刻掩膜，之后对半导体硅进行掺杂工艺，因为纯硅里只有掺入杂质才能变成半导体。
　　最后布上金属配线，再把完工的晶体管接入自动测试设备中，这个设备每秒可作一万次检测，以确保它能正常工作。
　　在通过所有的测试后必须将其封入一个陶瓷的或塑料的封壳中，这样它就可以很容易地装在一块电路板上了。
　　一块CPU的雏形就这样产生了。
CPU的历史
　　可以说Intel公司的历史就是一部CPU的发展史，下面以Intel为例简单说一下CPU的历史。
　　1971年。世界上第一块微处理器4004在Intel公司诞生了。它出现的意义是划时代的，比起现在的CPU，4004显得很可怜，它只有2300个晶体管，功能相当有限，而且速度还很慢。
　　1978年，Intel公司首次生产出16位的微处理器命名为i8086，同时还生产出与之相配合的数学协处理器i8087，这两种芯片使用相互兼容的指令集。由于这些指令集应用于i8086和i8087，所以人们也这些指令集统一称之为X86指令集。这就是X86指令集的来历。
　　1979年，Intel公司推出了8088芯片，它是第一块成功用于个人电脑的CPU。它仍旧是属于16位微处理器，内含29000个晶体管，时钟频率为4.77MHz，地址总线为20位，寻址范围仅仅是1MB内存。8088内部数据总线都是16位，外部数据总线是8位，而它的兄弟8086是16位，这样做只是为了方便计算机制造商设计主板。
1981年8088芯片首次用于IBM PC机中，开创了全新的微机时代。
　　1982年，Intel推出80286芯片，它比8086和8088都有了飞跃的发展，虽然它仍旧是16位结构，但在CPU的内部集成了13.4万个晶体管，时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位，地址总线24位，可寻址16MB内存。80286也是应用比较广泛的一块CPU。
　　1985年Intel推出了80386芯片，它X86系列中的第一种32位微处理器，而且制造工艺也有了很大的进步。80386内部内含27.5万个晶体管，时钟频率从12.5MHz发展到33MHz。80386的内部和外部数据总线都是32位，地址总线也是32位，可寻址高达4GB内存，可以使用Windows操作系统了。
　　1989年，Intel推出80486芯片，它的特殊意义在于这块芯片首次突破了100万个晶体管的界限，集成了120万个晶体管。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内，并且在80X86系列中首次采用了RISC（精简指令集）技术，可以在一个时钟周期内执行一条指令。它还采用了突发总线（Burst）方式，大大提高了与内存的数据交换速度。

FIFO(First IN First Out)先进先出电路

实现数据先进先出的存储器件，FIFO的用途:普遍用作数据缓冲器,可以用在电话通讯网络的前端来同步输入的网络数据包。也可以用于顺序数据的缓冲，比如音频信号或视频信号。另一个广泛的应用是在处理器之间的通讯中。

FIFO的基本单元是寄存器，作为存储器件，FIFO的存储能力是由其内部定义的存储寄存器的数量决定 . FIFO存储器一般以数据量的深度X宽度的形式来说明所采用的基本结构

第一代FIFO存储器是基于“导向”理论的，数据从输入端被移到输出端，所需要的时间称为导向时间

每一个数据字需要一个状态触发器，因此对数据锁存的控制只能实现很短的FIFO的操作

以长度为8的FIFO为例说明其工作原理。入图所示

____________________

D, C, B, A ——> | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8|———>

两边的箭头表示数据移动的方向。A，B，C，D表示被处理的数据。1，2，3，4，。。。8表示FIFO的8个存储单元。表明这个FIFO中共有8个寄存器单元。每个寄存器单元可以存储一个数据。所以寄存器的单元越多，FIFO的存储能力就越强。每个寄存器单元的位宽与FIFO的输入和输出端的位宽是一致的。如果要处理的数据A，B，C，D是16位的数据，那么输入输出端及每个寄存器单元的位宽就都是16位。这个FIFO可以命名为8X16FIFO。它在每一个时钟上升沿到来时，数据向右移动一个存储单元。这样在时钟的控制下，数据从左到右通过存储单元

FIFO通常是双端口的存储器，其中一个端口用于写入数据，而另一个端口用于读出数据。可以同时对存储器字存储单元进行写入和读出操作。它的数据吞吐率是普通RAM的两倍。

FIFO型的存储器不需要由地址来存取数据。需要由另外的信号线（或标志）来指明存储器的内容状态。

现在的FIFO存储器采用SRAM单元来实现。它是基于带两个指针的环行FIFO结构的。要写入的数据的存储地址放在写指针中，而FIFO结构中要读出的第一个数据的地址放在读指针中

在复位后，两个指针都指向存储器的同一个字单元。每次写操作后，写指针指向下一个存储单元。对数据字的读取操作，会把读指针指向下一个要读取的数据字

读指针就不断地跟随写指针，当读指针跟上写指针后，FIFO的结构里面为空。

如果写指针追上读指针，FIFO结构里面的数据是满载的。

如果从硬件上来实现循环存储器，可以用双端口的SRAM来存取数据。指针具用二进制计数器的特征，它用于产生SRAM的存储器地址

同步FIFO存储器的基本结构包括存储器阵列，标志逻辑和扩展逻辑（图太难画了，就不贴了）。

存储器阵列由双端口存储单元构成。允许同时对存储单元的两个端口（读端口和写端口）进行存取。

标志逻辑用于比较两个地址指针的值，如果两个值的比较结果为零，FIFO存储器为全空，同时全空标志为真。如果两个值的比较结果等于存储器的容量深度，说明存储器全满，同时全满标志为真。

还可以设置其他一些标志，比如半满，可编程接近满，可编程接近空等。它们也通过对偏移量寄存器中的编程值和存储器阵列中的字的数量进行比较来生成

（在张老师的课上，讲到读写时序的时候，关于标志逻辑，讲的太快，没有太深的体会，还需要看书1）

扩展逻辑通过对多个模块按容量深度扩展结构进行的级联来形成更深的FIFO存储器，采用令牌传递方法来实现逻辑上容量更深的FIFO。

在普通模式下（没有进行容量，深度级联的模式），每一个地址在到达最大值后，会跳会到零。

在容量深度扩展模式下，当地址指针到达最大值后，一个脉冲信号会送到扩展端口，该端口把令牌传到另一个FIFO存储器中，（直到令牌重新传回来，这个地址指针才会增加）（这个地方还有点模糊，有待解决。问过张老师，他却给我讲的是两个FIFO的乒乓操作。由于我的思路不是很清晰，也没有继续问下去。当时张老师也要开始讲课了，不好再打扰。）

字宽扩展，可以使FIFO存储器有更宽的数据通路

在字宽扩展模式中，读操作，写操作和重传输都一样。要在字宽上扩展多个FIFO存储器，必须同时通过对每个存储器的状态标志进行与操作生成“混合标志”。混合标志也包括全空标志和全满标志。这样才能保证FIFO存储器保持同步。

posted on 2008-04-29 09:43 Luckyer 阅读(1919) 评论(0) 收藏举报

刷新页面返回顶部

Mobile home

LCD 基础知识篇3

导航

公告