计算机组成原理基础
- 数字计算机的基本组成
- 控制器:操作控制功能。
- 运算器:计算功能。
- 存储器:记忆功能。
- 输入设备:交互接口、入。
- 输出设备:交互接口、出。
- 冯·诺依曼型计算机
- 有运算器、控制器、存储器、输入设备、输出设备组成。
- 采用存储程序的方式。
- 数据以二进制码表示。
- 指令由操作码和地址码组成。
- 指令在存储器中按执行顺序存放,有PC指明要执行的指令的单元地址,一般按顺序递增。
- 机器以运算器为中心。
- 计算机组成
- 计算机系统由硬件和软件组成。
- 软件分为系统软件和应用软件。
- 硬件如图
- 运算器
- 算数运算和逻辑运算。
- 在计算机中参与运算的数是二进制的。
- 运算器的长度一般是8、16、32、64位
- 存储器
- 存储数据和程序(指令)
- 容量(存储单元、存储单元地址、容量单位)
- 分类内存(ROM、RAM)、外存
- 存储器单位:
- 2^10byte=1K
- 2^10K=1M
- 2^10M=1G
- 2^10G=1T
- 控制器
- 指令和程序:指令的形式(操作码和地址码、存储程序的概念、指令中程序和数据的存放、指令系统)
- 指令和数据存储:
- 控制器的基本任务:按照一定的顺序一条接着一条取指令、指令译码、执行指令。取指周期和执行周期。
- 控制器完全可以区分开哪些是指令字,哪些是数据字。
- 一般来讲,取指周期中从内存读出的信息流是指令流,他流向控制器。
- 在执行周期中从内存读出的信息流是数据流,它由内存流向运算器。
- 计算机工作全过程
- 输入程序和数据。
- 程序首地址。(程序计数器PC)
- 启动运行程序
- 取指令(PC-地址寄存器MAR-读内存M-地址寄存器MDR-指令寄存器IR)
- 分析指令OP(IR)-CU
- 执行指令Ad(IR)-MAR-M-MDR-运算器ACC,之后取指令PC+1
- 。。。
- 打印结果
- 停机
- 软件的组成与分类
- 系统软件:
- 操作系统。
- 分布式系统软件。
- 应用软件
- 编程语言
- 手编程序:机器语言程序,手工编译二进制码。
- 汇编程序:符号语言程序,汇编程序汇编。
- 高级程序:算法语言/高级语言,机器编码程序/解释程序。
- 多级计算机系统
- 最底层:微程序设计级
- 机器级
- 操作系统级
- 汇编语言级
- 高级语言级
- 软件与硬件逻辑等价
- 计算机系统的软、硬件界限已经变得模糊。
- 任何操作可由软件来实现也可以有硬件来实现。
- 固件的概念(功能上是软件,形态上是硬件)
- 计算机性能指标
- 机器字节是指参与运算的数的基本位数,它是由加法器、寄存器的位数决定的。
- 数据总线一次所能并行传送信息的位数,称为数据通路宽度。
- 一个主存储器所能存储的全部信息量称为主存容量。
- 以字节数来表示存储容量。
- 也可以用字数乘以字长来表示存储容量。
- 吞吐量:是指系统在单位时间内处理请求的数量。
- 响应时间:是指系统对请求作出相应的时间,响应时间包括CPU时间、等待时间的总和。
- CPU主频:又称为时钟频率,表示在CPU内数字脉冲信号振荡的速度。
- 主频的倒数就是CPU时钟周期,这是CPU中最小的时间元素。每个动作至少需要一个时钟周期。
- CPI:是指每条指令执行所用的时钟周期数。
- CPI参数经常用IPC表示,即每个时钟周期执行的指令数。
- MIPS表示每秒执行多少百万条指令
- MIPS=指令条数/执行时间*10^6=主频/CPI=主频*IPC
- MFLOPS表示每秒执行多少百万次浮点运算
- 数制与编码
- R进制转换成十进制的方法
- 按权展开法:先写成多项式,然后计算十进制结果。
- 十进制转二进制
- 整数部分:
- 除二取余法
- 减权定位法
- 小数部分:
- 除二取整法
- 二进制转八进制(查表)
- 二进制转十六进制(查表)
- 字符与字符串:
- 字符:ASCII码,7位+1位校验位,共128个,10个数字及2个英文字母大小写。
- 字符串占用主存中连续的多个字节,每个字节存储一个字符。
- 高字节地址:高位字符。
- 低字节地址:低位字符。
- 校验码:
- 奇偶校验码。
- 海明校验码。
- 循环冗余校验码(CRC码)
- 数据校验码:是一种常用的带有发现某些错误或自动改错能力的数据编码方法。
- 基本原理:加进一些冗余码,使合法数据编码出现某些错误时,就成为非法编码。
- 码距:是根据任意两个合法码之间至少有几个二进制位不相同而确定的,若仅有一位不同,称其码距为1。
- 奇偶校验码:
- 是一种开销最小,能发现数据代码中一位出错情况的编码。
- 实现原理:是使原来合法编码码距由1增加到2.
- 实现的具体方法:通常是为一个字节补充一个二进制位,称为校验位,通过设置校验位的值0或1的方式,使字节自身的8位和该校验位含有1值的位数一定为奇数或偶数。
- 在使用奇数个1的方案进行校验时,称为奇校验;反之是偶校验。
- 奇偶校验只能发现一位错或奇数个位出错,但不能确定是哪一位错。
- 海明码校验:
- 只要增加少数几个校验位,并把数据的每一个二进制位分配在几个奇偶校验组中,当某一位出错后,就会引起有关的几个校验组的值发生变化,这不但可以发现错误,还能指出哪一位出错,为自动纠错提供了依据。
- 循环冗余校验(CRC)码
- CRC码可以发现并纠正信息串行读写、存储或传送过程中出现的一位、多位错误,因此在磁介质存储器读写和计算机之间通信方面得到广泛应用。
- CRC码一般是指k位信息码之后拼接r位校验码。
- 应用CRC码的关键是如何从k位信息位简便地得到r位校验位(编码)的值,以及如何从k+r位信息码判断是否出错。
- CRC的编码方法:模2运算是指以按位模2相加为基础的四则运算,运算时不考虑进位和借位。
- 模2加减:即按位加,可用异或逻辑实现,模2加和模2减的结果相同,两个相同数据的模2和为0。
- 计数制
- 真值:正、负号加绝对值。
- 机器数:在机器中使用的连同数符一起数值化的数
- 无符号数:指整个机器字长的全部二进制位均为数值位。没有符号位,相当于数的绝对值。若机器字长为8位,则数的表示范围是0~2^8-1,即0~255。
- 有符号数:需要将其符号数字化,即0为正,1为负。
- 3种有符号数的表示方法:原码、补码、反码。
- 原则:
- 原则1:3种机器数的最高位均为符号位,符号位和数值部分之间可用“.”或“,”隔开。
- 原则2:当真值为正数,原码、补码和反码的表示形式均相同,即符号位用“0”表示,数值部分与真值相同。
- 当真值为负数,原码、补码、反码的符号位是“1”
- 数值部分:补码是原码的每位求反再+1。
- 数值部分:反码是原码的每位求反。
- 所谓的每位求反均不包括符号位,只是对数值部分进行求反,且原码除了符号位为“1”,数值部分与真值相同。
- 表示法:
- 原码表示法:原码=符号+绝对值
- 真值0:根据原码的定义,小数0的原码有正负两种形式。
- 原码表示的特点:数的真值与它的原码之间的对应关系简单、直观、转换容易,但用原码实现加、减运算很不方便。
- 补码表示法:正数等于原码;负数,按位求反再+1。
- 真值零的补码是唯一的。
- 补码表示的特点:由于零有唯一的编码,因此,n位二进制数能表示2^n个补码,采用补码表示比用原码表示可多表示一个数。补码在机器中常用于作加、减运算。
- 反码表示法:正数等于原码;负数将原码按位取反。
- 真值零:用反码表示时,正数全0,负数全1。
- 已知补码求真值:
- 正数:补码即真值。
- 负数:求反+1,再配以符号,即真值。
- 一直反码求真值:
- 正数:反码即真值。
- 负数:对负数的反码求反,再配以符号即真值。
- 移码:
- 将补码的符号位求反。
- 数的定点表示
- 计算机中小数的小数点并不是用某个数字来表示的,而是用隐含的小数点的位置来表示的。
- 根据小数点的位置是否固定,又可分为定点表示和浮点表示。
- 定点小数:把小数点固定在符号位d0之后,数值最高位d-1之前。
- 定点整数:将小数点固定在数的最低位置后,这就是定点整数形式。
- 定点加、减法运算
- 定点补码加、减法与溢出
- 补码运算的优点:可将减法运算转化为加法运算,从而简化机器内部硬件电路的结构。
- 补码运算的特点:符号位和数值位一起参与运算,只要结果不发生溢出,得到的就是本次运算的结果。
- 补码的减法运算公式:[x]补-[y]补=[x+(-y)]补=[x]补+[-y]补
- 对一个数作取补的运算:对该数各位(含符号位)取反,然后在末位+1
- 补码性质:对[y]补 作取补运算得[-y]补;对[-y]补 作取补运算得[y]补。
- 补码加、减法运算规则
- 参加运算的数都用补码表示。
- 数据的符号与数据一样参加运算。
- 求差时将减数取补,用加法代替减法。
- 运算结果为补码。
- 符号位的进位丢掉。
- 溢出判断法:
- 两个符号相同的数相加,其运算结果的符号应与被加数符号、加数符号相同,如相反就出现溢出现象。
- 异号相加不会出现溢出。
- 两个符号相异的数相减,其运算结果的符号位应与被减数的符号相同,如相反则有溢出发生。
- 同符号数相减不会出现溢出。
- 判断溢出的方法:
- 双符号位法(变形补码法)
- 进位判断法
- 定点数的移位运算
- 左移:绝对值扩大
- 右移:绝对值缩小
- 带符号数的移位称为算数移位。
- 无符号数的移位称为逻辑移位。
- 数的浮点表示法
- 小数点的位置不固定,是浮动的。
- 溢出问题:
- 上溢:当一个浮点数规格化后的阶码大于机器最大阶码时,产生上溢,机器进行中断处理。
- 下溢:当一个浮点数规格化后的阶码小于机器码最小阶码,或尾数为0时,产生下溢,机器将该数当做零处理。
- 非数值数据的表示
- 字符表示:ASCII
- 汉字的输入:国标码、区位码、拼音码、五笔字型、机内码
- 运算器的结构
- 设计主要围绕ALU、寄存器、数据总线之间如何传送操作数和运算结果进行。
- 三种结构形式:
- 单总线结构运算器
- 双总线结构运算器
- 三总线结构运算器
- 存储器的分类:
- 按存储介质:磁表面/半导体存储器
- 按存取方式:随机/顺序存取
- 按读写功能:ROM、RAM
- RAM:静态RAM(SRAM)、动态RAM(DRAM)
- ROM:ROM/PROM/EPROM/EEPROM
- 按信息的可保存性:永久/非永久
- 按存储器系统中的作用:主/辅/缓/控
- 存储器的分级结构
- 特点:速度快的存储器价格贵、容量小;价格低的存储器速度慢、容量大。
- 存储器三个主要特性的关系:
- 存储相关概念
- 字存储单元:存放一个机器字的存储单元,相应的单元地址叫字地址。
- 字节存储单元:存放一个字节的单元,相应的地址称为字节地址。
- 存储容量:指一个存储器中可以容纳的存储单元总数。存储容量越大,能存储的信息就越多。
- 存储器带宽:单位时间内,存储器所存取的信息量,通常以位/秒或字节/秒 做度量单位。
- 存取时间:又称存储器访问时间:指一次读操作命令发出到该操作完成,将数据读出到数据总线上所经历的时间。通常取写操作时间等于读操作时间,故称为存储器存取时间。
- 存储周期:指连续启动两次读操作所需要的最小时间间隔。通常,存储周期略大于存取时间,其实践单位为ns
- 半导体随机存取存储器(RAM)
- 根据信息存储的机理不同可以分为两类:
- 静态读写存储器(SRAM):由双稳态管做存储元件,不掉电的前提下,信息不会丢失,存取速度快,但不宜构造大容量存储器。
- 动态读写存储器(DRAM):由电容做存储元件,即使不掉电也需要通过刷新保持所存储的信息,存取速度慢,易构造较大容量存储器。
- SRAM存储器的存储位元是一个触发器,它具有两个稳定的状态。
- DRAM存储器的存储位元是由一个MOS晶体管和电容器组成的记忆电路。
- 刷新周期:DRAM存储位元是基于电容器上的电荷量存储,这个电荷量随着时间和温度而减少,因此必须定期的刷新,以保持他们原来记忆的正确信息。
- 刷新操作
- 集中式刷新:DRAM的所有行在每一个刷新周期的连续时间内都被刷新。
- 分散式刷新:每一行的刷新插入到正常的读/写周期之中,在刷新周期内分散进行
- 存储器与CPU的连接&存储器容量的扩充
- 位扩展
- 给定的芯片字长位数较短,不满足设计要求的存储器字长,此时需要用多片给定芯片扩展字长位数。
- 三组信号线中,地址线和控制线公用而数据线单独分开连接。
- 所需芯片数量d=设计要求的存储器容量/选择芯片存储器容量
- 字存储容量扩展
- 字扩展指的是增加存储器中字的数量。静态存储器进行字扩展时,将个芯片的地址线、数据线、读写控制线相应并联,而由片选信号区分个芯片的地址范围。
- 所需芯片数d=设计要求的存储器容量/选择芯片存储器容量
- 字位扩展
- 实际存储器往往需要字向和位向同时扩充。
- 一个存储器的容量为M*N位,若使用L*K位存储器芯片,那么,这个存储器共需要(M/L)*(N/K)个存储器芯片。
- 闪速存储器
- FLASH存储器也可读作闪速存储器,它是高密度非失易失性的读/写存储器。
- 高密度意味着他具有巨大比特数目的存储容量。
- 非易失性意味着存放的数据在没有电源的情况下可以长期保存。
- 总之,它既有RAM的优点,又有ROM的优点,称得上是存储技术划时代的进展。
- 双端口存储器
- 逻辑结构
- 双端口存储器由于同一个存储器具有两组相互独立的读写控制电路而得名。
- 由于进行并行的独立操作,因而是一种高速工作的存储器,在科研和工程中非常有用。
- 无冲突读写控制
- 当两个端口的地址不相同时,在两个端口上进行读写操作,一定不会发生冲突。
- 当任一端口被选中驱动时,就可对整个存储器进行存取,每一个端口都有自己的片选控制(CE)和输出驱动控制(OE)。
- 读操作时,端口的OE(低电平有效)打开输出驱动器,有存储矩阵读出的数据就出现在I/O线上。
- 有冲突读写控制
- 当两个端口同时存取存储器同一存储单元时,便发生读写冲突,为解决这个问题,特别设置了BUSY标志。在这种情况下:
- 片上的判断逻辑可以决定对哪个端口优先进行读写操作。
- 而对另一个被延迟的端口置BUSY标志(BUSY变为低电平)。暂时关闭此端口。
- 多模块交叉存储器
- 一个由若干个模块组成的主存储器是线性编址的。这些地址在各模块中如何安排,有两种方式:
- 顺序方式
- 交叉方式。
- 相联存储器
- 原理:按内容存取的存储器,可以选择记录(关键字)的一个字段作为地址。
- 主要用途:在虚拟存储器中存放段表、页表、块表,也可以做Cache的行地址。
- Cache存储器
- 基本原理
- 功能:解决CPU和主存之间的速度不匹配问题
- 一般采用高速的SRAM构成。
- CPU和主存之间的速度差别很大采用两级或多级Cache系统。
- 早期的一级Cache在CPU内,二级在主板上。
- 现在的CPU内带L1 Cache和L2 Cache
- 全由硬件调度,对用户透明。
- Cache的设计依据:CPU这次访问过的数据,下次有很大的可能也访问附近的数据,局部性原则。
- CPU和Cache之间的数据传送是以块为单位。
- CPU读主存时,便把地址同时送给Cache和主存,Cache控制逻辑依据地址判断此字是否在Cache中,若在此字立即传送给CPU,否则,则用主存读周期把此字从主存读出送到CPU,与此同时,把含有这个字的整个数据块从主存读出送到Cache
- Cache的命中率
- 全相联的映射方式
- 映射方法(多对多):主存块内容可以拷贝到Cache的任意行
- 地址变换:标记实际上构成了一个目录
- 优点:冲突概率小,Cache的利用率
- 缺点:比较器难实现,需要一个访问速度很快的相联存储器
- 应用场合:适用于小容量的Cache
- 直接映射方式(一对多):
- 优点:比较电路少m倍线路,所以硬件实现简单,Cache地址为主存地址的低几位,不需变换。
- 缺点:冲突概率高(抖动)。
- 应用场合:适合大容量Cache
- 替换策略
- LFU(最近不经常使用):被访问的行计数器增加1,换值小的行,不能反映近期Cache的访问情况。
- LRU(近期最少使用):被访问的行计数器置0,其他的计数器增加1,换值大的行,符合Cache的工作原理。
- 随机替换:随机替换策略从特定的行位置中随机地选择去一行换出即可。
- 写操作策略
- 由于Cache的内容只是主存部分内容的拷贝,它应当与主存内容保持一致,而CPU对Cache的写入更改了Cache的内容。
- 如何与主存内容保持一致,可选用如下三种写操作策略:
- 写回法:换出时,对行的修改位进行判断,决定是写回还是舍掉。
- 全写法:写命中时,Cache与内存一起写。
- 写一次法:与写回法一致,但是第一次Cache命中时写入主存。
- 虚拟存储器
- 操作系统的形成和发展使程序员摆脱了主存和辅存之间的地址人工定位,通过软件、硬件结合,把主存和辅存统一成了一个整体,形成了一个存储层次。
- 从整体看,其速度接近于主存的速度,其容量接近于辅存的容量,而每位平均价格也接近于廉价的慢速的辅存平均价格。
- 这种系统不断发展和完善,就逐步形成了现在广泛使用的虚拟存储系统。
- 页式虚拟存储器
- 在页式虚拟存储系统中,把虚拟空间分成页,称为虚页或逻辑页,主存空间也分为同样大小的页,称为实页或物理页。
- 把虚拟地址分为两个字段,高位字段为虚页号,低位字段为页内字 地址。
- 虚页地址到主存实地址的变换是由页表来实现的。
- TLB(快表)
- 假设页表已调入主存储器中,在访问存储器时,先访问一次主存去查页表,再访问主存才能取得数据,这就相当于主存速度降低了一倍。
- 因此,把页表的最活跃的部分放在快速存储器中组成快表,这是减少时间开销的一种方法。
- 快表由硬件组成,通常称为转换旁路缓冲器,它是慢表的小小副本。
- 段式虚拟存储器
- 段是按照程序的逻辑结构划分的,各个段的长度因程序而异。
- 虚地址由段号和段内地址组成。段式虚拟存储器通过段表实现。
- 段页式虚拟存储器
- 在段页式虚拟存储器中,把程序按逻辑结构分段以后,再把每段分成固定的页。
- 程序对主存的调入调出是按页面进行的,但他又可以按照实现共享和保护。
- 因此,它可以兼取页式和段式系统的优点。
- 缺点是在地址映射过程中需要多次查表。
- 在这种系统中,虚拟地址转换成物理地址是通过一个段表和一组页表来进行定位的。
- 指令系统
- 指令的基本格式
- 一条指令中必须包含以下信息
- 操作码
- 操作数的地址
- 操作结果的存储地址
- 下一条指令的地址
- 一条指令实际上包括两种信息,即操作码和地址码。
- 操作码用来表示该指令要完成的操作。
- 地址码用来描述该指令的操作对象。
- 零地址指令:只有操作码,没有地址码
- 一地址指令:操作数的存储地址或寄存器名,指令只给出一个地址,该地址既是操作数的地址,又是操作结果的存储地址。
- 二地址指令:第一个源操作数的存储器地址和寄存器地址,第二个源操作数和存放操作结果的存储器地址或寄存器地址。
- 三地址指令:第一个源操作数的存储器地址或寄存器地址,第二个源操作数的存储器地址或寄存器地址,操作结果的存储器地址或寄存器地址。
- 多地址指令:大、中型机甚至高档小型机中,往往设置一些功能很强的,用于处理成批数据的指令,如字符串处理指令,向量、矩阵运算指令等。
- 定长操作码指令格式:操作码的长度决定了指令系统中完成不同操作的指令条数。若操作码长度为k位,最多只能有2^k条不同指令。
- 扩展操作码指令格式:操作码长度可变,且分散的放在指令字的不同字段中,操作码长度不固定将增加指令译码和分析的难度,使控制器的设计复杂化,因此对操作码的编码至关重要。
- 通常是在指令字中用一个固定长度的字段来表示基本操作码,而对于一部分不需要某个地址码的指令,把他们的操作码扩充到该地址码字段。
- 指令的寻址方式:
- 寻址方式:确定本条指令的操作数地址及下一条欲执行指令的指令地址。
- 有效地址:操作数的真实地址称为有效地址,记作EA
- 分类:
- 指令寻址
- 数据寻址
- 常见的寻址方式:
- 立即寻址
- 直接寻址
- 隐含寻址(操作数地址隐含在操作码中)
- 间接寻址EA=(A)
- 寄存器寻址
- 寄存器间接寻址
- 基址寻址
- 相对寻址
- 堆栈寻址