小甲鱼零基础汇编语言学习笔记第三章之寄存器(内存访问)
这章涉及了一个重点概念——栈(还好有栈,让系统有了那么多的漏洞)。
1、内存中字的存储
1个字=2个字节,如从0开始存放20000(4E20H),20、4E分别表示1个字节,内存中字的存储如下图所示:
这里,0号单元对应的是低地址单元,1号单元对应的是高地址单元。
任何两个地址连续的内存单元(0、1、2......),N号单元和N+1号单元,可以看成两个内存单元。比如说上图中的0内存单元(字节单元),存放的是字节型数据,就是20H(十进制的32);0地址字单元,存放字型数据,就是4E20H。
任何两个地址连续的内存单元,N号单元和N+1号单元,也可以看成一个地址为N的字单元中的高位字节单元和低位字节单元。比如上图中1字单元中,所代表的字是124EH,高位字节单元是2内存单元——12H,低位字节单元是1内存单元——4EH。
2、DS和[address]
CPU读取内存单元时,必须先读取到这个内存单元的地址。8086CPU中,内存地址是由段地址和偏移地址组成(第二章中有介绍),并且有一个DS寄存器,用来存放要访问的数据的段地址。地址很重要,就像生活当中,要前往一个地方,我们必须要知道这个地方的地址,才能够决定我们如何去这个地方。
8086CPU中,通常有一个DS寄存器,用来存放要访问的数据的段地址。
例子:读取10000H单元的内容,可以用这样的一段代码来实现:
mov bx,1000H
mov ds,bx
mov al,[0]
解释:上面的代码是将10000H(1000:0)中的数据读取到al中。这里为什么不直接mov 10000H到ds中呢?这是因为8086CPU的设 计问题,其实没有什么原因,工程师就是这样设计的,不必深究(感觉废话连篇,哈哈)。
mov al,[0] 这一段代码又是什么意思呢?首先我们要知道,mov指令,就目前而言我们所知道的功能有两种:第一种就是直接将数据放到寄存器中(mov ax,2);第二种,将一个寄存器中的内容传递到另一个寄存器当中(mov bx,ax)。除去这两种功能,mov指令还能够将一个内存单元中的内容送入一个寄存器。那么mov al,[0] 这句代码就好理解了,就是将内存单元中,偏移地址为0的内存单元中的内容放入到ax通用寄存器中的低八位al(8位)中。一个段地址对应一个偏移地址,上面的代码中,段地址为1000,对应的偏移地址为0。CPU是如何自己找到段地址对应的偏移地址的呢?CPU中有其自身的索引机制,感兴趣的同学可以自行去百度或者google一下。
综上所述,上面的代码就可以理解为cpu从内存单元10000H(1000:0)中读取到数据,然后把值传递给ax寄存器中的al。
3、如何将1000H送入到DS(段寄存器)中?
我们既然可以 "mov ax,1000" ,那么可以“mov ds,1000H”吗?
答案是NO。8086CPU不支持直接将数据放入段寄存器中,ds是一个段寄存器。至于为什么不能,这在上面也说了是设计上的问题 。所以CPU从内存中读取内容,就是这样一个过程:数据--->通用寄存器--->段寄存器。
4、如何将数据从寄存器送入到内存中呢?
比如要把al中的数据送入到内存单元10000H中,我们可以通过以下的代码完成:
mov bx,1000H
mov ds,bx
mov [0],al
这里就是一个逆向思维的体现。
5、字的传送
8086CPU是16位结构,有16根数据线,所以一次性可以传送16位的数据,也就是一次性传送1个字(1个字=2个字节=16位)。
如下代码:
mov bx,1000H
mov ds,bx
mov ax,[0] ---->这里是将1000:0处的字型数据(1个字,16位)送入到ax(16位)当中
mov [0],cx ---->这里是将cx(16位)中的数据放入到1000:0(16位)内存单元中。
6、已知mov指令的几种形式
mov 寄存器,数据 ---->mov ax,2C3B
mov 寄存器,寄存器 ---->mov bx,ax
mov 寄存器,内存单元 ---->mov ax,[0]
mov 内存单元,寄存器 ----->mov [0],bx
mov 段寄存器,寄存器 ---->mov ds,ax
既然内存单元和寄存器之间可以互相赋值,那么寄存器和段寄存器之间可以互相赋值吗?(也就是可以执行 mov 寄存器,段寄存器吗?)答案是YES。同学们可以自行debug一下。
这么多指令,没必要去背,多敲一敲就记住了。
这里能不能像mov指令一样,对段寄存器进行操作呢?(比如 add 寄存器,段寄存器)答案是no。这个也可以自行debug一下。我电脑上这样做,是会报错的:
7、数据段
前面一章说过,对于8086CPU,我们可以根据需要,将一组内存单元定义为一个段(可以是代码段,也可以是数据段)
我们可以将一组长度为N(N<=64)、地址连续、起始地址为16的倍数的内存单元用于存放数据的内存空间,这样我们就定义了一个数据段。比如我们使用内存单元123B0H--123B9H这样一个连续内存单元来存放数据,它的段地址就是:123BH,偏移地址是0H到9H之间,长度就是10个字节。
那么我们应该如何来读取数据段呢?将一段内存当成数据段,这是在编程时候的一种安排,在具体操作的时候,我们可以使用ds来存储数据段的段地址,再根据需要,用相关指令访问数据段中的具体单元。
这里我们定义123B0H到123BAH为数据段,现在要累加数据段中的前3个单元中的数据,应该这样写代码:
mov ax,123BH ---->把段地址存入到ax中
mov ds,ax ---->通过ax这个中介,将段地址123BH转交给ds段寄存器中
mov al,0 ---->使用al来存放累加结果(为什么用al?因为问题中说的是单元,没有说前3个字,默认字节,所以用al(占8位))
mov al,[0] ---->将数据段第一个单元(偏移地址为0)加到al中
mov al,[1] ---->将数据段第二个单元(偏移地址为1)加到al中
mov al,[2] ---->将数据段第三个单元(偏移地址为2)加到al中
上面的问题假如修改为累加数据段中的前3个字型数据数据呢?代码应该如何修改?其实很简单,只需要将al修改为ax即可,字型数据占16位嘛,ax寄存器也就是16位的嘛,对应一下,替换一下就ok了。还有就是将偏移地址修改为[0]、[2]、[4],一个字占两个单元嘛。
8、小结
9、栈的概念
栈是具有特殊访问方式的存储空间,特殊性就在于其中的数据是后进先出(LIFO)。
两个基本操作:入栈(将一个新元素放到栈顶)和出栈(从栈顶取出一个元素)。
栈顶的元素总是最后入栈,需要出栈时,又最先被取出来。
现今的CPU中,都有栈的设计,8086CPU提供相关指令来以栈的方式访问内存,这意味着,我们在基于8086CPU编程的时候,可以将一段内存当做栈来使用。
入栈指令:push 出栈指令:pop
push ax:就是将寄存器ax中的数据存入栈中 pop ax:就是将数据从栈中取出,放到ax寄存器中。8086CPU对栈的操作,数据都是以字为单位的(因为是16位)。
示例代码:
mov ax,0123H
push ax
mov bx,2266H
push bx
mov cx,1122H
push cx
pop ax
pop bx
pop cx
10、两个问题
CPU怎么知道一段空间被当做栈来使用呢?执行push和pop指令时,如何知道哪个单元是栈顶呢?
首先我们回顾一下CPU是如何指导当前要执行的指令的位置。寄存器CS和IP中存放着当前要执行的指令的段地址和偏移地址。
在8086CPU中,有两个寄存器,一个是段寄存器SS,用来存放栈顶的段地址;一个是寄存器SP,存放栈顶的偏移地址。任何时刻,SS:SP指向栈顶元素。
在push一个元素时,首先SP会减2,然后再将ax中的数据送入到SS:SP指向的内存单元处,SS:SP指向新的栈顶。如下图所示:
此时,我们思考一个问题,当栈为空的时候,SS:SP又会指向哪里呢?SS:SP指向最高地址的下一个单元,在执行完第一个push命令后,SS:SP指向栈中的第一个元素。如下图所示:
pop的操作则是相反的,SS:SP就是加2。如下图所示:
注意,pop之后的数据并不是真的从栈中移除掉,pop之后的数据仍然存在于栈中,只不过SS:SP不再指向被pop的那个内存单元。栈中的数据只是在不断的被新的数据所覆盖。
11、栈顶越界的问题
如何保证入栈、出栈不越界呢?(从另外一个角度来看,就是黑客经常使用的攻击手段——内存溢出攻击)
8086CPU不保证我们的栈操作不越界,所以要我们自己来操心栈顶越界的问题。
12、push和pop指令可以在寄存器和内存之间传送数据
push和pop分别可以进行寄存器的数据入栈和出栈,也可以进行段寄存器的数据入栈和出栈,亦可以进行内存单元之间的数据传递。
目前我们十分清楚的是,push和pop指令和mov指令不同,CPU执行mov指令只需要一个步骤,执行push和pop需要两步:
执行push时,首先sp加2,后向ss:sp处传送;执行pop时,先读取ss:sp处的数据,后改变sp(sp-2)。push和pop等栈的操作指令,修改的只是sp,也就是说对于16位的CPU而言,栈顶的变化范围在0~FFFFH之间。
13、栈段
前面一章说过,对于8086CPU,我们可以根据需要,将一组内存单元定义为一个段(可以是代码段,也可以是数据段)
我们可以将一组长度为N(N<=64)、地址连续、起始地址为16的倍数的内存单元当作栈来使用,这样我们就定义了一个栈段。将一段内存当作栈段来使用,仅仅是我们编程时的一种设置,CPU并不会由于这种设置,就在执行push、pop等栈操作指令时,就自动将我们定义的栈段当作栈空间来访问。CPU只认识SS:SP指向的栈顶,不会知道栈空间是从哪里到哪里。
一个栈段最大可以设置为多少呢?答案是2^16,即64KB(对于16位的8086CPU而言)。
14、段的综述
要如何定义一个段,这个段用来干什么,完全是编程人员的想法,CPU只认识地址。