通过机器码程序理解冯诺依曼体系
这篇文章的排版和内容都很糟糕,我会找个时间重写他。
冯诺依曼体系结构
简介
现今所有的商用计算机都是基于冯诺依曼体系的计算机。
冯·诺依曼体系结构冯·诺依曼理论的要点是:计算机的数制采用二进制;计算机应该按照程序顺序执行。存储程序原理,把程序本身当作数据来对待,程序和该程序处理的数据用同样的方式储存,二者地位是相等的。
通过机器码程序理解 冯诺依曼 计算机
下面将通过基于Pep8虚拟计算机运行的机器码程序理解冯诺依曼计算机。(Pep8是用于教学的开源小型计算机,可以执行机器码和汇编程序 下载链接 http://computersystemsbook.com/5th-edition/pep9/ )
首先介绍 冯诺依曼周期
一个冯诺依曼周期包含 5 个操作:
- 取指
- 译码
- 增加PC(程序计数器)
- 执行指令
- 重复
如图:加载机器语言到内存
初始化寄存器(PC,SP,IR等)
do {
取下一条指令
解码 指令指示符
递增PC
执行取出的指令
} while(没有执行停止指令)
指令和寄存器
每种计算机都有自己的指令集,固化在cpu中。Pep8有39条指令,这些指令分为两类,由一个字节(8位二进制)组成的 指令指示符,或者由一个 指令指示符 和一个由一个字(两个字节)组成的 操作数指示符 组成。
Pep8中包含不限于PC(程序指令计数器),SP(栈指针计数器),IR(24位指令寄存器(3字节))等寄存器。
将要用到的指令:
0000 0000 停止执行
0100 1aaa 字符输入
0101 0aaa 字符输出
注(aaa表示一个字段,a可为0或1,表示寻址方式)
一个字符输出程序
地址 机器语言(bin)
---- -------
0000 0101 0001 0000 0000 0000 0111
0003 0101 0001 0000 0000 0000 1000
0006 0000 0000
0007 0100 1000
0008 0110 1001
地址 机器语言(hex)<br>
---- -------- <br>
<span class="hljs-number">0000</span> <span class="hljs-number">510007</span><br>
<span class="hljs-number">0003</span> <span class="hljs-number">510008</span><br>
<span class="hljs-number">0006</span> <span class="hljs-number">00</span><br>
<span class="hljs-number">0007</span> <span class="hljs-number">48</span><br>
<span class="hljs-number">0008</span> <span class="hljs-number">69</span><br>
输出
----
Hi
这两段代码是等价的,只不过是前者更利于计算机识别和读取,后者利于人类,但是计算机最终是要保存二进制的序列,而非其他任何形式的结果。(注:地址为了便于表示使用四位十六进制数表示)
分析程序
首先将上面代码输入Pep8虚拟机后,首先要做的是,装载。即将每条指令(每行右侧序列)装载到左侧序列标识的地址。如果装载的指令是一元指令即 指令指示符 ,那么他占据一个内存单元即一个字节。如果指令是一个二元指令也即 操作数指示符 那么他占据三个内存单元,所以第一条指令被装载到 0000、0001、 0002 所标识的内存。
当所有的指令装载完成后,也就意味着一个程序在内存中,并处于可执行状态。注意一点,这个程序的指令在内存中是逐条紧邻的。
执行程序
根据 冯诺依曼周期,程序是顺序执行的,所以初始化程序指令计数器PC,
PC: 0000
CPU根据PC的值作为内存地址索引,找到该内存并将该内存的值(二进制序列)复制,通过总线传输到CPU的指令寄存器IR中,
IR:Mem[PC] // 类比 数组索引值 a[i];
此时CPU解释IR中的指令,指令:0101 0001 0000 0000 0000 0111
我们来解释一下这个指令,首先这是一个二元指令,所以前一个字节是指令指示符,后两个字节是操作数指示符。第一个字节 0101 0001 (原指令模式 0101 0aaa)代表以直接寻址的方式输出字符,后两个字节指示要输出的字符的地址,可以看出,这块地址就是之前我们装载程序时 0007 这块内存,而内存中的值正是 ‘H’ 的ASCII码值 48 。到此我们可以看出,其实 程序 和 程序的数据 对于计算机来说没有区别,都是保存在内存中的二进制数,计算机只单纯的将他们作为二进制数处理,而是作为 指令 被解释还是作为 数据 被解释是需要我们来定义。
接下来继续程序的执行,当获取到 操作数指示符 标识内存中的值后,将这个值发送到输出设备,此时由输出设备负责将该二进制数解释为字符。
下一步,根据取出指令的长度进行PC的自增。重复上述过程,直到
PC:0006
索引值为指令
0000 0000 ;结束指令
程序结束。