软考笔记(一)高级系统架构师/分析师:计算机系统基础
备考2021 软考高级系统架构师笔记 整理中...
目录
- 软考官网 报名通道
- 软考架构师笔记(一):计算机系统基础
- 软考架构师笔记(二):计算机网络基础与信息安全
- 软考架构师笔记(三):操作系统基础
- 软考架构师笔记(四):企业信息化与系统规划
- 软考架构师笔记(五):系统需求工程 需求分析
- 软考架构师笔记(六):数据库
- 软考架构师笔记(七):系统分析 系统设计
- 软考架构师笔记(八):系统架构
- 软考架构师笔记(九):软件工程与项目管理
- 软考架构师笔记(十):系统测试 维护 稳定性
Flynn分类法
、
指令集 CISC RISC
CISC复杂指令集:指令多,指令频率差别大,复杂度高,多寻址,微程序控制技术(微码)实现译码,
RISC精简指令集:指令数量少,指令频率接近,大多数在一个机器周期完成,单周期,少寻址,多通用寄存器,硬布线逻辑控制,操作寄存器,适用于流水线,优化编译效率,支持高级语言。
流水线技术
流水线是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。
各种部件同时处理是针对不同指令而言的,它们可同时为多条指令的不同部分进行工作,以提高各部件的利用率和指令的平均执行速度。
并行包括同时性与并发性两种含义,同时性指两个或两个以上的事件在同一时刻发生,并发性指的是两个或两个以上的事件在同一时间间隔发生。
流水线建立时间:1条指令执行时间。
流水线周期:执行时间最长的一段
一条指令的执行过程可以分3个阶段:
取指:按照指令计数器的内容访问主存储器,取出一条指令送到指令寄存器。
分析:对指令操作码部分进行译码,按照给定的寻址方式和地址字段中的内容形成操作数地址,并用这个地址读取操作数。
执行:把运算结果写到通用寄存器或主存中。
顺序执行的过程:
取址 -》分析 -》执行
使用流水线执行过程:
相关的计算考点:
流水线执行时间(理论公式):(t1+t2+..+tk)+(n-1)*∆t
流水线执行时间(实践公式):k*∆t +(n-1)*∆t
流水线吞吐率:吞吐率TP=指令数/执行时间
流水线最大吞吐率:
流水线加速比:顺序执行时间/流水线执行时间
计算机开机过程
BIOS引导程序是固化在ROM芯片上的,每当开机时自动执行BIOS引导程序。它主要执行如下任务:
·标识和配置所有的即插即用设备。如果系统有即插即用设备的BIOS,系统将搜索和测试所有安装的即插即用设备,并为它们分配DMA通道、IRQ及它们需要的其他设备。
·完成加电自检(POST)。加电自检主要检测和测试内存、端口、键盘、视频适配器、磁盘驱动器等基本设备。有一些新版本的系统还支持CD-ROM驱动器。
·对引导驱动器可引导分区定位。在CMOS中,用户可以设置系统的引导顺序,以便对引导驱动器的可引导分区重新定位。大多数系统的引导顺序是软件驱动,然后是硬件驱动,其次是CD-ROM驱动器。
·加载主引导记录及引导驱动器的分区表,执行主引导记录MBR。
主引导记录在硬盘上找到可引导分区后,将其分区引导记录装入内存,并将控制权交给分区引导记录。由分区引导记录定位根目录,再装入操作系统。
存储系统
层次化存储结构
寄存器
指令寄存IR 器用来存放从内存中读取的指令。
通用寄存器GR 可用于传送和暂存数据,也可参与算术逻辑运算,并保存运算结果。
程序计数器PC 是用于存放下一条指令所在单元的地址。当执行一条指令时,首先需要根据PC中存放的指令地址,将指令由内存取到指令寄存器中,即将程序计数器PC中的内容送到地址总线上,此过程称为”取指令”。与此同时,PC中的地址或自动加1或由转移指针给出下一条指令的地址。此后经过分析指令,执行指令。完成第一条指令的执行,而后根据PC取出第二条指令的地址,如此循环,执行每一条指令。
状态寄存器PSW 用于存放状态标志与控制标志如,中断标志、溢出标志等。
Cache
Cache的功能提高CPU数据输入输出的速率,突破冯,诺依曼瓶颈,即CPU与存储系统间数据传送带宽限制。
在计算机的存储系统体系中,Cache是访问速度最快的层次。
使用Cache改善系统性能的依据是程序的局部性原理。
时间局部性:如果一个信息项正在被访问,那么在近期很可能还会被再次访问。程序的循环,堆栈等是产生时间局部性的原因;
空间局部性:指一旦程序访问了某个存储单元,不久以后,其附近的存储单元也将被访问,即程序在一段时间内所访问的地址可能集中在一定的范围内,其典型情况是程序顺序执行。
工作集理论:工作集是进程运行时被频繁访问的页面合集
工作原理 :依据局部性原理,把主存储器中访问概率高的内容存放在cache中。当CPU需要读取数据时,首先在cache中查找是否有所需内容,如果有,则直接从cache中读取;
若没有,再从主存中读取该数据,然后同时送往CPU和cache。
如果CPU需要访问的内容大多能在cache中找到(访问命中),则可以大大提高系统性能。
CPU发出访存请求后,存储器地址先被送到cache控制器以确定所需数据是否已在cache中,若命中则直接对cache进行访问。该过程称为cache的地址映射。常见的映射方法有直接映射、相联映射和组相联映射。
直接相联映像:硬件电路较简单,但冲突率很高。
全相联映像:电路难于设计和实现,只适用于小容量的cache,冲突率较低。
组相联映像:直接相联与全相联的折中。
Cache中数据装满后必须淘汰现有数据,装入新数据,淘汰算法有:随机淘汰法、先进先出法FIFO、近期最少使用淘汰法LRU。
Cache写数据常用方法包含以下几类:
写直达:当要写cache时,数据同时写回主存储器,也称为写通,也叫贯穿。
写回:CPU修改cache的某一行后,相应数据不立即写入主存,而在该行被从cache中淘汰时,才把数据写回主存储器中。
标记法:对cache中的每个数据设置一个有效位。当数据进入cache后,有效位置1,当CPU要对该数据进行修改时,只需将其写入主存储器,并将该位清0。
当要从cache中读取数据时,需要测试其有效位:若为1则从cache中取,否则从主存中取。
校验码
校验码通常是一组数字的最后一位,由前面的数字通过某种运算得出,用以检验该组数字的正确性。
常见的校验码有中华人民共和国居民身份证的最后一位、ISBN号码的最后一位、组织机构代码的最后一位、数据传输的正确性验证码等。
代码作为数据在向计算机或其它设备进行输入时,容易产生输入错误,为了减少输入错误,编码专家发明了各种校验检错方法,并依据这些方法设置了校验码。
- 奇偶校验:只检奇数位错,不能纠错。
- 循环校验码CRC:可查错,不可纠错,运用模二除法计算校验码。
- 海明校验:可查错,可纠错;海明校验码校验位计算:2r>=r+m-1。
https://baijiahao.baidu.com/s?id=1594263251060755624&wfr=spider&for=pc
常见校验码分类:
码距
奇偶校验码
海明码
把校验码放到 2的n次方位,多种奇偶校验交错在一起
10 9 8 7 6 5 4 3 2 1
上面有6个信息位,4个校验位
CRC循环冗余校验码
原始报文 使用模2运算 除一个约定好的 多项式,为了整除 需要给源码补充上 几位(实际上一定是多项式最高次幂-1) 接收放 收到后,用同样的多项式去验证;
编码及浮点数运算
原码:为二进制的数,如:10 原码0000 1010
反码:正数与原码相同,如:10 反码0000 1010
负数为原码0变1,1变0,(符号位不变)
如:-10 原码1000 1010
反码1111 0101
补码:正数的补码与原码相同,如:10 补码 : 0000 1010
负数的反码为补码减1,如:-10 反码:1111 0101
补码:1111 0110
计算机中数字以补码储存,因为原码和反码计算不准确,而补码是准确的,补码可以直接处理正负数的加减。
浮点数:科学计数法: N=尾数*基数(的指数)
1、浮点数各部分表示意义:N = 尾数*基数指数
(1)一般尾数用补码,阶码用移码;
(2)阶码的位数决定数的表示范围,位数越多范围越大;
(3)尾数的位数决定数的有效精度,位数越多精度越高。
浮点数所能表示的数值范围如下:最大的正数
2、浮点数运算规则:对阶 > 尾数计算 > 结果格式化
(1)对阶时,小数向大数看齐;
(2)对阶是通过较小数的尾数右移实现的。
性能指标及阿姆达尔解决方案
计算机系统的性能一般包括两个大的方面。
一个方面是它的可靠性或可用性,也就是计算机系统能正常工作的时间,其指标可以是能够持续工作的时间长度(例如,平均无故障时间),也可以是在一段时间内,能正常工作的时间所占的百分比;
另一个方面是它的处理能力或效率,这又可分为三类指标,
第一类指标是吞吐率(例如,系统在单位时间内能处理正常作业的个数)
第二类指标是响应时间(从系统得到输入到给出输出之间的时间)
第三类指标是资源利用率,即在给定的时间区间中,各种部件(包括硬设备和软件系统)被使用的时间与整个时间之比。
当然,不同的系统对性能指标的描述有所不同,例如,计算机网络系统常用的性能评估指标为信道传输速率、信道吞吐量和容量、信道利用率、传输延迟、响应时间和负载能力等。
主频,时钟周期,总线周期,指令周期
主频和CPU时钟周期(Clock Cycle):主频又称为时钟频率,时钟周期是时钟频率的倒数。
主频为1GHz 则说明1秒钟有1G个时钟周期,每个时钟周期为1000*1000*1000/1G=1ns.
指令周期(Instruction Cycle):取出并执行一条指令的时间。
总线周期(BUS Cycle):也就是一个访存储器或I/O端口粮作所用的时间。
指令周期、总线周期和时钟周期之间的关系:一个指令周期由若干个总线周期组成,而一个总线周期时间又包含有若干个时钟周期(也可说一个指令周期包含若干个时钟周期)。
MIPS,MFIOPS
吞吐率指的是单位时间内完成的任务数,常用的表示方式有MIPS和MFILOPS.
MIPS:每秒处理的百万级的机器语言指令数,主要用于衡量标量机性能
MFLOPS:每秒百万个浮点操作,不能反映整体情况,只能反映浮点运算情况,主要用于衡量t向量机性能。
Amdahl定律
可靠性
可靠性用平均无故障时间(MeanTime To Failure MTTF)来度量,即计算机系统平均能够正常运行多长时间,才发生一次故障。系统可靠性越高,平均无故障时间就越长。
可维护性用平均维修时间(MTTR)来度量,即系统发生故障后维修和重新恢复正常运行平均花费的时间,系统的可维护性越好,平均维修时间越短。
计算机系统可用性是系统保持正常运行时间的百分比,定义为:MTTF/(MTTF+MTTR)×100%.
用户容易对可靠性和可用性产生混淆,二者的重要区别是系统是可维修的还是不可维修的。可靠性通常低于可用性,因为可靠性要求系统在整个[0,t]时间段内都必须正常运行;而对于可用性的要求就没有那么高,系统可以发生故障,然后在时间段[0,t]内修复。
性能评价方法
真实程序>核心程序>小型基准程序>合成基准程序
时钟频率法:以时钟频率高低衡量速度。
指令执行速度法:表示机器运算速度的单位是MIPS。
等效指令速度法:通过各类指令在程序中所占的比例(W;)进行计算得到的。特点:考虑指令比例不同的问题。
数据处理速率法(PDR):PDR值的方法来衡量机器性能,PDR值越大,机器性能越好。PDK=L/K特点:考虑CPU+存储
综合理论性能法(CTP):CTP用MTOPS(Million Theoretical Operations Per Second,每秒百万次理论运算)表示。CTP的估算方法是,首先算出处理部件每个计算单元的有效计算率,再按不同字长加以调整,得出该计算单元的理论性能,所有组成该处理部件的计算单元的理论性能之和即为CTP。
基准程序法:把应用程序中用得最多、最频繁的那部分核心程序作为评估计算机系统性能的标准程序,称为基准测试程序(benchmark)。基准程序法是目前一致承认的测试系统性能的较好方法。 考虑了诸如IVO结构、操作系统、编译程序的效率对系统性能的影响,
计算机性能评估方法基本上分为两大类,分别是测量方法和模型方法。
测量方法指通过一定的测量设备或测量程序,可以直接从系统中测得各项性能指标或与之密切的相关度量,然后,由它们经过一些简单的运算,求出相应的性能指标。
模型方法的基本思想是,首先对要评估的系统建立适当模型,然后求出模型的性能指标,以便对系统进行性能评估。本试题考查的是测量方法中的经典评测方法的基本知识。
测量方法中经典的性能评估方法有时钟频率法、指令执行速度法、等效指令速度法、数据处理速率法、综合理论性能法等。
时钟频率法:计算机的时钟频率在一定程度上反映了机器速度,对于同一种机型的计算机,时钟频率越高,计算机的速度就越快,但是不同体系结构的计算机,相同频率下,其速度和性能可能会差别很大。
指令执行速度法:计算机发展中,由于加法的指令速度大体上可反映出乘法、除法等其他算术运算的速度,而逻辑运算、转移指令等简单指令的执行时间往往设计成与加法指令相同,因此可以采用加法指令的运算速度来衡量计算机的速度。
等效指令速度法:也称为吉普森或混合比例计算法,是通过各类指令在程序中所占的比例进行计算后得到的计算机运算速度。
数据处理速率法(ProcessingDataRate,PDR):采用计算PDR值的方法来衡量机器性能,PDR值越大,机器性能越好。PDR与每条指令和每个操作数的平均位数以及每条指令的平均运算速度有关。PDR主要对CPU和主存储器的速度进行度量,不适合衡量机器的整体速度,不能全面反映计算机的性能,因为它没有涉及Cache、多功能部件等技术对性能的影响。
综合理论性能法:该方法是首先计算出处理部件每个计算单元的有效计算率,再按不同字长加以调整,得出该计算单元的理论性能,所有组成该处理部件的计算单元的理论性能之和即为最终的计算机性能。
多媒体
颜色:
真彩色是指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。
伪彩色图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT(Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。
这种用查找映射的方法产生的色彩称为伪彩色。
直接色的像素值分为红、绿、蓝子域,每一个子域索引一份独立的色彩映射,可改变色彩映射的内容。
矢量是一种既有大小又有方向的量,又称为向量。一般来说,在物理学中称作矢量,例如,速度、加速度、力等就是这样的量。合弃实际含义,就抽象为数学中的概念一向量。在计算机中,矢量图可以无限放大永不变形。
视频:
多信息文本格式(RTF)是一种方便于不同的设备、系统查看的文本和图形文档格式。
WAV为微软公司发的一种声音文件格式,它符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。
MPEG是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台支持。它包括MPEG-1,MPEG-2,MPEG-4等。
MPEG-1被广泛地应用在VCD(Video Compact Disk)的制作,绝大多数的VCD采用MPEG-1格式压缩。 MPEG-1视频中的帧间编码主要采用了基于运动补偿的帧间预测编码,帧内编码主要采用了变换编码。
MPEG-1标准中,视频图像的帧序列包括帧内图像(l帧)、预测图像(P帧)和插补图像(B帧),或称双向预测图像3种。帧内图像(l帧)不参照任何过去的或者将来的其他图像帧,压缩编码直接采用类JPEG的压缩算法,故其可以直接作为索引和访问点;
MPEG-21是ISO/IEC制定为一个标准,致力于定义多媒体应用的一个开放框架。
预测图像使用基于运动补偿的单向帧间预测编码;而插补图像则使用双向帧间预测编码。
MPEG-2应用在DVD(Digital Video/Versatile Disk)的制作方面、HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面。MPEG格式视频的文件扩展名通常是MPEG或MPG。
JPG全名是JPEG,JPEG图片以24位颜色存储单个位图。JPEG是与平台无关的格式,支持最高级别的压缩,不过,这种压缩是有损耗的。渐近式JPEG文件支持交错。
蓝光(Blu-ray)或称蓝光盘(Blu-ray Disc,缩写为BD)利用波长较短(405nm)的蓝色激光读取和写入数据,并因此而得名。而传统DVD需要光头发出红色激光(波长为650nm)来读取或写入数据,通常来说波长越短的激光,能够在单位面积上记录或读取更多的信息。因此,蓝光极大地提高了光盘的存储容量,对于光存储产品来说,蓝光提供了一个跳跃式发展的机会。目前为止,蓝光是最先进的大容量光碟格式,BD激光技术的巨大进步,使你能够在一张单碟上存储25GB的文档文件。这是现有(单碟)DVDs的5倍。在速度上,蓝光允许1~2倍或者说每秒4.5~9兆字节的记录速度。
声音:
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
ADPCM编码在PCM脉冲编码调制的基础上引入了“自适应”的思想。“自适应”是指根据输入信号幅度大小自动地改变量化阶的大小。
LPC是根据过去已有的几个采样值的模型的线性组合来推断现在的采样值,进而用实际采样值与预测采样值之差(预测误差)及线性预测系数进行编码。
MPEG音频编码方法使用了心理声学模型。