第四章处理器体系结构 学习报告
第四章 处理器体系结构
4.1 Y86指令集体系结构
定义一个指令集体系结构,例如Y86,包括定义各种状态元素、指令集和他们的编码、一组变成规范和异常事件处理。
4.1.1 程序员可见的状态
①程序员可见的状态:Y86中每条指令都会读取或修改处理器状态的某些部分。这里的“程序员”既可以是用汇编代码写程序的人,也可以是产生机器代码的编译器。
Y86的处理器状态类似IA32。有8个程序寄存器:%eax,%ecx,%edx,%ebx,%esi,%esp和%ebp。处理器的每个程序寄存器存储一个字。
②存储器,从概念上来说是一个很大的字节数组,保存着程序和数据。Y86程序用虚拟地址来引用存储器位置。硬件和操作系统软件联合起来将虚拟地址翻译成实际或物理地址,指明数据实际保存在存储器那个地方。
4.1.2 Y86指令
Y86指令集基本上是IA32指令集的一个子集。它只包括四字节整数操作、寻址方式比较少、操作也较少。因为只有四字节数据,所以称之为“字”不会有任何歧义。
左边是指令的汇编码表示,右边是字节编码。汇编码格式类似于IA32的ATT格式。
4.1.3 指令编码
4.1.4 Y86异常
对于Y86,当遇到这些异常的时候,我们就简单的让处理器停业执行指令。
在更完整的设计中,处理器通常会调用一个异常处理程序,这个过程被指定用来处理遇到的某种类型的异常。
4.1.5 Y86程序
4.1.6 一些Y86指令的详情
4.2 逻辑设计和硬件控制语言HCL
4.2.1 逻辑门
4.2.2 组合电路和HCL布尔表达式
组合电路:讲很多的逻辑门组成一个网,就能构成计算块。
构建这些网有两条限制:①两个或多个逻辑门的输出不能连接在一起,否则他们可能会使线上的信号矛盾,可能会导致一个不合法的电压或电器故障。
②这个网必须是无环的。
4.2.3 字节的组合电路和HCL整数表达式
4.2.4 集合关系
4.2.5 存储器和时钟
4.3 Y86的顺序实现
4.3.1 将处理组织成阶段
下面是关于各个阶段以及各阶段内执行操作的简略描述:
- 取指:取指阶段从存储器读取指令字节,地址为程序计数器(PC)的值。
- 译码:译码阶段从寄存器文件读入最多两个操作数,得到val A/val B.
- 执行:执行阶段,算术/逻辑单元要么执行指令明确的操作(根据ifun的值),计算存储器引用的有效地址,要么增加或减少栈指针。得到的值称为valE
- 访存:访存阶段可将数据写入存储器或从存储器读出数据
- 写回:最多可写两个结果到存储器。
- 更新PC:将PC设置成下一指令的地址。
4.3.2 SEQ硬件结构
4.3.3 SEQ的时序
4.3.4 SEQ阶段的实现
4.4 流水线的通用原理
流水线化的一个重要特性就是增加了系统的吞吐量,也就是单位时间内服务的顾客总数,不过他也会轻微地增加延迟,也就是服务一个客户所需要的时间。
4.4.1 计算流水线
4.4.2 流水线操作的详细说明
4.4.3 流水线的局限性
- 不一致的划分
- 流水线过深,收益反而下降
4.4.4 带反馈的流水线系统
作业:
课后作业:2.90,2.82,3.55,3.62
2.90:
A: 格式 SEEEEEEE EMMMMMMM MMMMMMMM MMMMMMMM
pi的二进制数表示为:0 10000000 10010010000111111101011,
S: 为0,是个正数。
E:为 10000000 转为10进制为128,128-127=1,即实际指数部分为1.
M:为 10010010000111111101011。 这里,在底数左边省略存储了一个1,使用 实际底数表示为 1.10010010000111111101011 , 它表示的二进制小数值为:11.10010010000111111101011
B.根据2.82,可知1/7的表示为0.001001[001]..., 所以22/7为11.001001001001001[001]...
C.从第9位开始不同。
2.82
A.
令x为无穷序列表示的值,可以得到
x*2^k = Y + x
所以
x = Y/(2^k - 1)
B. (a) y=001,k=3,带入公式得:
x=1/7
(b) y=1001,k=4,带入公式得:
x=9/15 = 3/5
(c)y=000111,k=6,带入公式得:
x=7/63 = 1/9
3.55
大概算法如下:
x的高32位为xh,低32位为xl。
y的符号位扩展成32位之后为ys(ys为0或者-1)。 dest_h = (xl*ys)_l + (xh*y)_l + (xl*y)_h dest_l = (xl*y)_l
注意,所有的乘法都是unsigned*unsigned。
也就是说对于 1*(-1),如果存入两个寄存器中,那么高32位是0,低32位是-1。 相当于 1*(UNSIGNED_MAX)。
3.62
M = 76/4 = 19;
i在edi中,j在ecx中;
int transpose(int M, int A[M][M]) {
int i,j;
for(i=0; i<M; ++i) {
int *a = &A[i][0];
int *b = &A[0][i];
for(j=0; j<i; ++j) {
int t = *a;
*a = *b;
*b = t;
++a;
b += M;
}
}
}