随笔 - 24 文章 - 0 评论 - 0 阅读 - 2987

20192407邢继元汇编语言程序设计1~4章学习笔记

第一章基础知识
一.汇编语言的一般概念
1.机器语言：把控制计算机的命令和各种数据直接用二进制数码表示。
优点：运行速度最快，程序长度最短。
缺点：不便记忆，难以阅读。
2.高级语言：使用类似自然语言的一些语句编制程序。
优点：程序设计简单。
缺点：程序效率较低。
3.汇编语言：使用字母和符号来表示机器语言的命令，用十进制或十六进制数表示数据。

一条汇编语言的语句与一条机器语言指令相对应，与其效率相同。
不同类型计算机有不同的机器指令系统和汇编语言描述。

附：机器语言的执行主要取决于CPU。
CPU的结构：寄存器个数及作用；访问存储器的方式；输入输出操作方式。

二.学习使用汇编语言的目的
1.认识理解计算机工作过程。
2.有些计算机功能必须用汇编语言程序实现。
3.汇编语言效率高于高级语言程序。

三.进位计数制及其相互转换
1. 进位计数制：使用一定个数的数码组合表示数字。

各个位置上表示的基本数值称为位权，简称权。
每个数位上能使用不同数码的个数称为基数。
B：二进制数
O或Q：八进制数
D：十进制数
H：十六进制数
未使用任何字母默认十进制

2.各种数制间的相互转换
（1）十转二：
整数：减权定位法；除基取余法
小数：减权定位法；乘基取整法
（2）二转十：
整数：按权相加法；逐次乘基相加法
小数：按权相加法；逐次除基相加法
（3）二转八（十六）：
三（四）位二进制数对应一位八（十六）进制数

四.带符号数的表示

用+,-表示正负的叫真值，用0,1表示正负的叫机器数。
1.原码表示
2.补码表示：
正数原码和补码相同；负数符号位不变，将各位变反然后在最低位加一
补码加减运算：

五.字符的表示

目前最广泛使用的：ASCII码
标准ASCII码共128个，分为两类：
33个非打印ASCII码：用于控制操作。
95个可打印ASCII码：数字字符，大小写字母等。

六.基本逻辑运算
1.与运算（AND）:
逻辑乘运算：
A,B都为1时，F才为1，否则为0
2.或运算（OR）：
逻辑加运算：
A,B至少有一个为1时，F才为1，否则为0
3.非运算：

4.异或运算（XOR）：

A与B相同时,F为0，不同时为1

第二章 IBM-PC微机的功能结构
一.IBM-PC微机的功能介绍
1.微机的一般构成
（1）构成：运算器，控制器，存储器，输入设备，输出设备。
（2）总线结构：地址总线，数据总线，控制总线。具有较大的灵活性和扩展性。
（3）中央处理器CPU：运算器和控制器集成在一个集成电路芯片上时，称为中央处理器，简称CPU，也叫微处理器。

功能：分析指令，控制各部件完成指定功能的各项操作。

（4）主存储器：用来存放程序和数据的部件，由若干存储单元构成。

习惯上将CPU和主存储器合称为主机。除了主存储器外，一般还有辅助存储器，简称辅存，也叫外村。

（5）输入输出设备及接口：

输入设备将外部信息送入计算机（鼠标键盘等）；
输出设备将计算机处理后的结果转换为人或其他系统能识别的信息形式向外输出（显示器，打印机等）；
有的设备同时有输入和输出功能（磁盘，磁带，触摸显示屏等）。
I/O设备因和主机的差异要通过I/O接口才能与系统总线连接。
I/O接口是主机与I/O设备之间设置的逻辑控制部件，通过他实现彼此的信息传送。

（6）系统总线：将CPU，存储器和I/O设备连接起来。
二.Intel 8086/8088CPU的功能结构
（1）串行方式：

特点：

CPU在指令执行阶段不需要占用系统总线，系统总线空闲时间较多。
从存储器取指令，取数据或存数据时，总线处于忙状态且占用时间长。而CPU却只需要花很短的时间去处理，因此大部分时间处于闲置状态。
运行速度较慢

（2）指令流水线方式：

执行单元EU：分析与执行指令。（取出指令代码，产生控制信号，控制完成操作；执行逻辑运算；向总线接口单元BIU发送命令并提供相应地址数据）
总线接口单元BIU：负责CPU与存储器，I/O的信息传送。（取指令；存取数据）
EU和BIU的操作在一定程度上并行，分别完成不同的任务，从而大大加快了指令执行速度。
执行过程

三.Intel 8086/8088CPU寄存器结构及其用途

（1）通用寄存器：Intel 8086/8088有8个16位通用寄存器，它们具有良好的通用性，并且可以用作某个特定功能。

数据寄存器：AX,BX,CX,DX
既可以用来存放参加运算的操作数，也可以存放运算的结果。
在有些指令中，不需要明确指出使用的寄存器名，即隐念使用了某寄存器，称为隐含使用。
个别指令对寄存器有特定的使用，并且又必须在指令中指明它的名字，这类寄存器的使用称为特定使用。
指针寄存器：堆栈指针SP（在进行堆栈操作时，被隐含使用，被用来指向堆栈顶部单元）和基址指针BP（被用来指向堆栈段内某一存储单元也可当作数据寄存器使用）。
变址寄存器：有两个是六位的变址寄存器SI和DI，一般被用来作地址指针。

（2）段寄存器

CPU在访问存储器时必须指明两个内容：
所访问的存储单元属于哪个段，即指明使用的段存储器。
该存储单元与段起始地址（段基址）相距多少，即偏移量。

（3）指令指针IP
CPU在从存储器取指令时，以段寄存器CS作为代码段的基址指针，以IP的内容作为偏移量，共同形成一条指令的存放地址。
当CPU从内存中取出一条指令后，IP内容自动修改为指向下一条指令。

（4）标志存储器：用来反映CPU在程序运行时的某些状态，如是否有进位，奇偶性，结果的符号，结果是否为零。

8086/8088CPU寄存器中标志寄存器的长度为16位，但只定义了其中的9位。
标志位分为
状态标志：CF,PF,AF,ZF,SF,OF
控制标志：TF,DF,IF
进制标志位CF
奇偶标志位PF
辅助进位标志位AF
零值标志位ZF
符号标志位SF
溢出标志位OF
单步标志位TF
中断允许标志位IF
方向标志位DF

四.存储器的组织结构
（1）存储器的组成：

存储器存储器是由若干个存储单元构成。
每个存储单元存放相同长度的二进制数。
每个存储单元有一个唯一的地址编号——地址。
任何两个相邻字节单元就构成一个字单元。
在定义一个地址时必须指出是字节或字类型属性。

（2）存储器的段结构

8086/8088CPU将1MB的存储空间划分成若干个段，每个段最大长度为64K个字节单元组成。
每个段基址必须是一个小节的首址。（段基址：一个段的起始地址）
逻辑段在物理存储器中可以是邻接的、间隔的、部分重叠的和完全重叠的等4种情况。
在任一时刻，一个程序只能访问4个当前段中的内容。

（3）逻辑地址与物理地址及对应关系

物理地址
在1MB的存储空间中，每个存储单元的物理地址是唯一的，它就是该存储单元的20位地址。
逻辑地址
在程序设计中，为了便于程序的开发和对存储器进行动态管理，使用了逻辑地址。
一个逻辑地址包括两个部分：段基值和偏移量
段基值:存放在某一个段寄存器中，是一个逻辑段的起始单元地址(段基址）的高16位。
偏移量:表示某个存储单元与它所在段的段基址之间的字节距离。
逻辑地址转换为物理地址
当CPU要访问存储器时，需要由总线接口单元BIU将逻辑地址转换成物理地址。
转换方法:将逻辑地址的段基值左移4位，形成20位的段基址（低位为0）然后与16位的偏移量相加，结果即为20位的物理地址。
逻辑地址的来源
在程序的执行过程中，CPU根据不同操作类型访问存储器，其逻辑地址中段基值和偏移量的来源是不一样的。下表是各种操作类型所对应的逻辑地址的来源。
说明
允许替代来源也叫做段超越,它表示了段基值除使用隐含的段寄存器外是否可以指定其它段寄存器来提供。
有效地址EA，它表示根据指令所采用的寻址方式计算出来的段内偏移量。

五.堆栈及其操作方法

堆栈的用途:主要用于暂存数据以及在过程调用或处理中断时保存断点信息。
（1）堆栈的构造：
专用堆栈存储器：按堆栈的工作方式专门设计的存储器
软件堆栈：由程序设计人员用软件在内存中划出的一块存储区作为堆栈来使用。8086/8088采用这种方式。

（2）8086/8088堆栈的组织：
（3）堆栈操作

设置堆栈：主要是对堆栈段寄存器SS和堆栈指针SP赋值
进栈PUSH：
执行过程：
首先将堆栈指针SP减2，即指向一个空的堆栈字单元。
再将要储存的内容（寄存器或存储单元的内容）送入SP指向的字单元中。
出栈POP
操作过程:
将SP指向的字单元（即栈顶字单元）内容送往指定的寄存器或存储器。
再堆栈指针SP内容加2，即:SP<= (SP) +2

第三章寻址方式与指令系统
一.寻址方式

寻找指令中所需操作数的各种方法，也就是提供指令中操作数的存放信息的方式
操作码:表示该指令应完成的具体操作，如加法、减法、乘法、移位等等。在汇编语言中使用一定的符号来表示，称为助记符。如ADD、PUSH、POP、MOV等等。
操作数:表示该指令的操作对象。如移位操作的被移位数，加法操作的加数等等。它可以是一个操作数，也可以是多个操作数。这取决于操作码部分的具体需要。
Intel 8086/8088各指令中提供操作数的方法有以下四种:
（1）立即数操作数——操作数在指令代码中提供
（2）寄存器操作数——操作数在CPU的通用寄存器或段寄存器中
（3）存储器操作数——操作数在内存的存储单元中
（4）I/O端口操作数——操作数在输入/输出接口的寄存器中
1.立即数寻址：立即数寻址方式的指令中，所需操作数直接包含在指令代码中，这种操作数称为立即数。
注意:立即数只能作为源操作数，而不能作为目的操作数。
2.寄存器寻址：寄存器寻址方式是指指令中所需的操作数在CPU的某个寄存器中。寄存器可以是8位或16位通用寄存器，或者是段寄存器。
由于存取寄存器操作数完全在CPU内部进行，不需要总线周期，所以执行速度很快。
一个存储单元逻辑地址表示形式:段基值:偏移量
段基值由某个段寄存器提供.
偏移量表示了该存储单元与段起始地址之间的距离，也叫做有效地址EA。
有效地址EA是以下三个地址分量的几种组合，由CPU的执行单元EU计算出来的。
（1）位移量:位移量是指令中直接给出的一个8位或16位数。一般源程序中以操作数名字(变量名或标号)的形式出现。
（2）基址:由基址寄存器BX或基址指针BP提供的内容。
（3）变址:由源变址寄存器SI或目的变址寄存器DI提供的内容

3.直接寻址
（1）用符号表示
（2）用常数表示

4.寄存器间接寻址：事先将偏移量存放在某个寄存器(BX、BP、SI或DI)中，这些寄存器就如同一个地址指针。在程序运行期间，只要对寄存器内容进行修改，就可以实现用同一条指令实现对不同存储单元进行操作。指示存储器所在段的段奇仔器可以省略，当指令中使用的是BP寄存器，则隐含表示使用SS段寄存器，其余情况则隐含使用DS段寄存器。

5.基址寻址/变址寻址：操作数的有效地址EA等于基址分量或变址分量加上指令中给出的位移量。段寄存器的隐含使用规则与寄存器间接寻址方式相同

注意:当位移量为常数时，不能加方括号。
这两种寻址方式只需通过改变寄存器的内容就可用一条指令访问不同的存储单元，并且由于增加了一个位移量分量，因此它们能够很方便地访问数组和表格数据。
由于这两种寻址方式中寄存器中的内容是相对于由位移量指定的初始单元。因此也叫寄存器相对寻址。

6，基址变址寻址：

在基址变址寻址方式中，程序运行期间有两个地址分量可以修改。因此它是最灵活的一种寻址方式，可以方便地对二维数组进行访问。

存储器操作数寻址方式中地址形成小结：

7.串操作寻址方式：
8086/8088设置有专门用于串操作的指令，这些指令的操作数虽然也在存储器中，但它们不使用前面介绍的各种寻址方式，而隐含地使用变址寄存器SI和DI专门指示。

在寻找源操作数时，隐含使用SI作为地址指针。
在寻找目的串时，隐含使用DI作为地址指针。
在串操作完成之后，自动对SI和DI进行修改，使它们指向下一个操作数。

8.I/O端口寻址：
（1）存储器编址方法：将I/O端口视为存储器的一个单元，对端口的访问就如同访问存储单元一样。访问存储器的指令和各种寻址方式同样适用对1/O端口的访问。

特点:程序设计灵活，但需要占用存储地址空间

（2）I/O端口编址方法：I/O端口的地址与存储器地址分开，并使用专门的输入指令和输出指令。

直接端口寻址：在指令中直接给出端口地址，端口地址一般采用2位十六进制数，也可以用符号表示。
直接端口寻址可访问的端口数为0～255个。
寄存器间接揣口寻址：寄存器间接端口寻址:把IO端口的地址先送到DX中，用DX作间接寻址寄存器。
如果访问的端口地址值大于255,则必须用I/O端口的间址方式

二.指令系统
一种计算机所能执行的各种类型的指令的集合称为该计算机的指令系统。

Intel8086/8088CPU指令系统的指令可以分为六大类:
传送类指令
算术运算类指令
位操作类指令
串操作类指令
程序转移类指令
处理器控制类指令
从指令的格式划分，一般可以分为三种:
双操作数指令:OPR DEST SRC
单操作数指令:OPR DEST
无操作数指令:OPR
对于无操作数指令，包含两种情况:
指令不需要操作数，如暂停指令HLT；
在指令格式中，没有显式地指明操作数，但是它隐含指明了操作数的存放地方，如指令PUSHF

一.传送类指令：传送类指令的作用是将数据信息或地址信息传送到一个寄存器或存储单元中，可以分为以下四种情况。

1.通用数据传送指令
指令格式:MOV DEST，SRC
作用:将源操作数指定的内容传送到目的操作数，即DEST<=(SRC)。
当指令执行完后，目的操作数原有的内容被源操作数内容覆盖，即目的操作数和源操作数具有相同内容。
MOV指令对标志寄存器的各位无影响
MOV指令可以是字节数据传送也可以是字数据传送，但是源操作数和目的操作数的长度必须一致。
MOV指令可以分为以下几种情况:

立即数传送到通用寄存器或存储单元
注意:立即数只能作为源操作数，立即数不能传送给段寄存器。
寄存器之间的传送
注意:段寄存器CS只能作源操作数，不能作目的操作数。
寄存器与存储单元之间传送

综合起来，MOV指令在使用时需注意以下几个问题:

立即数只能作源操作数，且它不能传送给段寄存器。
段寄存器CS只能作源操作数，段寄存器之间不能直接传送。
存储单元之间不能直接传送数据
MOV指令不影响标志位

2.交换指令
作用:源操作数和目的操作数两者内容相互交换，即:(DEST)<=>(SRC)。

指令对标志寄存器各位无影响
数据交换可以在寄存器之间或寄存器与存储器单元之间进行。但是不能在存储单元之间直接进行数据交换。寄存器只能使用通用寄存器。

3.标志传送指令：对标志寄存器进行存取的指令有4条，它们都是无操作数指令，即指令隐含指定标志寄存器、AH寄存器或堆栈为操作数。
（1）取标志寄存器指令
指令格式: LAHIF
作用:将标志寄存器的低8位送入AH寄存器，即将标志SF、ZF、AF、PF和CF分别送入AH的第7、6、4、2、0位，而AH的第5、3、1位不确定。
（2）存储标志寄存器指令
指令格式:SAHF
作用:将寄存器AH中的第7、6、4、2、0位分别送入标志寄存器的SF、ZF、AF、PF和CF各标志位。而标志寄存器高8位中的各标志位不受影响。
（3）标志进栈指令
指令格式:PUSHF
作用:先将堆栈指针SP减2，使其指向堆栈顶部的空字单元，然后将16位标志寄存器的内容送SP指向的字单元。
（4）标志出栈指令
指令格式:POPF
作用:将由SP指向的堆栈顶部的一个字单元的内容送入标志寄存器，然后SP的内容加2.
4.地址传送指令

这类指令有3条，它们的作用是将存储单元的地址送寄存器。

（1）装入有效地址
格式:LEA DEST，SRC
其中:源操作数SRC必须是一个字节或字存储器操作数(地址），DEST必须是一个16位通用寄存器。
作用:将SRC存储单元地址中的偏移量，即有效地址EA传送到一个16位通用寄存器中。

指令执行对标志寄存器各位无影响。
(2）装入地址指针
指令格式:
LDS DEST, SRC
LES DEST，SRC
其中:DEST是任意一个16位通用寄存器。SRC必须是一个存储器操作数。
作用:把SRC存储单元开始的4个字节单元的内容(32位地址指针)送入DEST通用寄存器和段寄存器DS (LDS指令)或ES （LES指令),其中低字单元内容为偏移量送通用寄存器，高字单元内容为段基值送DS或ES。

二、算术运算类指令
8086/8088指令系统中有加、减、乘、除指令，这些指令可以对字节数据或字数据进行运算。
参加运算的数可以是无符号数，也可以是带符号数。带符号数用补码表示。
参加运算的数可以是二进制数，也可以是十进制数（以BCD码表示）。
1.加法指令
指令格式:ADD DEST，SRC
功能:目的操作数和源操作数相加，其和存放到目的操作数中，而源操作数内容保持不变，即：DEST<=(DEST)+(SRC)。

根据相加的结果将影响到标志寄存器的CF、PF、AF、ZF、SF和OF。
DEST只能是通用寄存器或存储器操作数。不能是立即数。
SRC可以是通用寄存器、存储器或立即数操作数DEST和SRC不能都为存储器操作数。
ADD指令可以是字节操作数相加，也可以是字操作数相加。

下列各指令功能：
（1）ADDAX,CX
功能:将寄存器AX的内容与CX的内容相加，结果传送到AX中
（2）ADD AH,DATA_BYTE
功能:将由直接寻址方式所指示的存储单元的内容与AH内容相加，结果送回AH中。
（3）ADD CX,10H
功能:将常数10H加入到CX中。为字操作数指令。
（4）ADD AX, [BX][SI]
功能：将由基址变址寻址方式所致使得存储单元的内容加入到AX中
2.带进位加法指令
指令格式:ADC DEST，SRC
该指令的功能与ADD基本相同，所不同的是其结果还要加上进位标志CF的值，即:
DEST<=(DEST)+(SRC)+CF
根据相加的结果设置标志寄存器中的CF、PF、AF、ZF、SF和OF

注意:参加运算的进位CF是本条指令执行之前的值。用ADC指令可实现数据长度大于16位的两数相加

3.加1指令
指令格式:INC DEST
目的操作数可以是任意的8位、16位通用寄存器或存储器操作数。目的操作数被视为带符号二进制数
根据指令执行结果设置PF、AF、ZF、SF和OF标志，但不影响CF。INC指令主要用于某些计数器的计数和修改地址指针。

4.减法指令
指令格式:SUB DEST,SRC
功能:目的操作数的内容减去源操作数的内容，结果送入目的操作数，源操作数中内容保持不变。即:DEST<=(DEST) - (SRC)
操作结果将影响标志位CF、PF、AF、ZF、SF和OF。

目的操作数DEST和源操作数SRC可以是8位或16位的通用寄存器、存储器操作数，但两者不能同时为存储器操作数。立即数只能作源操作数。
注意:减法指令对借位标志的影响，若采用变减为加的运算方法，则产生的进位与CF标志结果相反。

5.带借位减法
指令格式: SBB DEST，SRC
该指令的功能与SUB指令基本相同，不同的是在两个操作数相减后再减去进位标志CF的值。即:DEST<=(DEST)—(SRC)一CF。

注意:该CF的值是本条指令执行前的结果。
SBB指令在使用上与ADC类似，主要用于长度大于16位的数相减，即将低16位相减的结果引入高位部分的减法中。

根据指令执行结果设置PF、AF、ZF、SF、OF和CF。

6.减1指令
指令格式:DEC DEST
该指令为单操作数指令，将目的操作数的内容减1后，送回到目的操作数。即:DEST<=(DEST)—1
DEST可以是8位或16位的通用寄存器存储器操作数,该指令将DEST看作是带符号二进制数。
根据指令执行结果设置PF、AF、ZF、SF和OF,但不影响CF。

DEC指令的使用类似INC指令。主要用于计数和修改地址指针，计数方向与INC指令相反。

7.求负数指令
指令格式:NEG DEST
功能:用零减去目的操作数的内容，并送回目的操作数，即:DEST<=0-(DEST)
DEST可以是任意一个8位或16位的通用寄存器或存储器操作数，被视为带符号的操作数。
由于机器中带符号数用补码表示，求操作数的负数就是求补操作。因此，NEG指令也叫取补指令。NEG指令将影响标志PF、AF、ZF、SF、CF和OF。

对进位标志CF的影响:
只有当操作数为零时，进位标志CF被置零，其它情况都被置1.
对溢出标志OF的影响:
当字节操作数为-128，或字操作数为-32768时，执行NEG指令的结果操作数将无变化，但溢出标志OF被置1.

三.位操作类指令
1.逻辑运算指令
逻辑运算指令共有4条，它们的指令格式分别是:
逻辑“与”指令AND DEST，SRC
逻辑“或”指令OR DEST，SRC
逻辑“异或”指令XOR DEST，SRC
逻辑“非”指令NOT DEST
DEST和SRC可以是8位或16位的通用寄存器或存储器操作数，但两者不能同时为存储器操作数，SRC可以为立即数。

逻辑指令对标志位的影响:
NOT指令对标志无影响。而其余三条指令将根据结果影响SF、ZF和PF，而CF和OF总是置0，AF为不确定。
逻辑运算指令除用来实现各种逻辑运算之外，还常用于对字节或字数据的某些位的组合、分离或位设置。

2.测试指令
指令格式:TESTDEST SRC
该指令的功能与AND指令相似，实现源操作数与目的操作数进行按位“逻辑与”运算，对标志位的影响与AND指令相同，但运算的结果不送入目的操作数，即目的操作数内容也将保持不变。

TEST指令主要用于测试某一操作数的一位或几位的状态。

3.移位/循环移位指令
这一类指令共有8条,分为3类。
（1）算术移位
算术左移SALDEST，COUNT
算术右移SAR DEST，COUNT
（2）逻辑移位
逻辑左移SHI DEST，COUNT
逻辑右移 SHR DEST，COUNT
逻辑左移SHL与算术左移SAL功能相同。
（3）循环移位

小循环:
循环左移ROLDEST，COUNT
循环右移ROR DEST，COUNT
大循环:
带进位循环左移RCL DEST，COUNT
带进位循环右移RCR DEST，COUNT

这8条指令具有以下几个共同点:
（1）DEST为操作对象，它可以是字节或字操作数，可以是通用寄存器或存储器操作数。
（2）COUNT用来决定移位/循环的位数，即确定移位的次数。
（3）在执行移位时，根据指令不同，每移位一次,最高位（左移）或最低位（右移）都要送到进位标志CF。
（4）前4条移位指令根据移位结束后修改标志位CF、PF、ZF、SF和OF，而AF不确定。而后4绦循环移位指令根据移位结束后的结果仅修改CF和OF

对溢出标志位OF的影响:
移位次数为1时，移位前后操作数的符号位发生变化，则OF被置1，否则置0。移位次数大于1时，OF不确定。
指令SAL和SAR当移位次为n时，其作用相当于乘以2n或除以2"，因此被叫做算术移位指令。
为了保持其算术运算结果的正确性，移位后的结果不能发生溢出。
对于多字节或多字数据的移位，需要使用带进位循环移位指令。

四、处理器控制类指令
处理器控制类指令包括以下三种情况。
1.标志位操作指令
它们都是无操作数指令，操作数隐含为标志寄存器的某个标志位。能直接操作的标志位有CF,IF和DF
（1）清除进位标志 cg;置CF为0
（2）置1进位标志 ST9﹔置CF为1
（3）进位标志取反 CMC ;CF的值取反
（4）清除方向标志 CLD;置DF为0
（5）置1方向标志 STD;置DF为1
（6）清除中断标志 CLI;置IF为0
（7）置1中断标志 STI;置正F为1
2.与外部事件同步的指令
HLT：暂停指令
WAIT：等待指令
ESC：外部协处理器指令前缀
LOCK：总线锁定指令
3.空操作指令NOP
执行一次NOP占用CPU三个时钟周期，它不改变任何寄存器或存储单元内容，主要用于延时。

三.指令编码
汇编:将汇编语言程序转换为机器语言程序的过程
汇编程序:在计算机中实现汇编过程的系统程序
Intel8086/8088汇编指令的编码格式有四种基本格式
1.双操作数指令编码格式
2.单操作数指令编码格式
3.与AX或AL有关的指令编码格式
4.其它指令编码格式
一.双操作数指令编码格式
对于象MOV、ADD、AND等双操作数指令，操作数可以是以下两种情形:
一个操作数在寄存器中，另一操作数在寄存器或存储器中。
目的操作数在寄存器或存储器中，源操作数是立即数。
这类指令的机器目标代码长度为2～6个字节
1.操作特征部分
这部分为指令编码的首字节，它又分为以下三个段。
（1）OPCODE:操作码字段
该字段长度为6bit。它表示了该指令所执行的功能和两个操作数的来源。
（2）方向字段d
该字段与第2部分寻址特征一起来决定源操作数和目的操作数的来源。

注意:当源操作数为立即数Imm时，d字段无效，它被并入操作码字段。

（3）字/字节字段W
当W=1时,表示两操作数长度为字;当W=0时，表示两操作数长度为字节。

2.寻址特征部分
它与操作特征部分的方向字段d结合，指定两个操作数分别使用什么寻址方式，及使用哪个寄存器。
它包括MOD、REG和R/MS个字段,REG字段确定一个操作数,而MOD和R/M字段确定另一个操作数。
当d=1时，则目的操作数由REG字段确定，而源操作数由MOD和R/M字段确定。
（1）REG字段
由REG字段确定的一个操作数是某一通用寄存器的内容，即使用的是寄存器寻址方式。
第一部分中的W字段决定操作数是字或是字节。
它们配合使用可以有16种组合，也即可以分别制定16个寄存器之一。如下表所示

（2）寻址方式字段MOD和寄存器/存储器字段R/M
这两个字段共同确定一个操作数。该操作数可以在寄存器中，也可以在存储器中
3.位移量部分
根据寻址特征中MOD和R/M字段确定的有效地址计算方法，位移量可以是以下三种情况之一:
没有位移量
1字节位移量disp8
2字节位移量disp16
4.立即数部分
如果指令的源操作数为立即数，则指令编码中包含有该部分。它总是位于指令编码的最后1~2字节。

二.单操作数指令编码格式
这种编码格式适用于只有一个操作数的指令，如INC、DEC、移位/循环等指令。指令编码为2~3字节。
操作特征部分:包括OPCODEV和W三个字段，其中V字段只有移位/循环指令中才有该字段。其它指令中没有该字段。

V=0时，指令中使用常数1作为移位或循环次数。
V=1时，指令中使用寄存器CI作移位次数。
由于单操作数指令中只有一个操作数，因此寻址特征部分就不需要REG疗段，而该字段被用作辅助操作码。

三.与AX或AL有关的指令编码格式
这种编码格式用于隐含指定AX/AL作为一个操作数的双操作数指令，其编码格式为:

采用这种编码格式的指令，除一个操作数隐含指定为AX/AL外，另一个操作数可以是立即数或存储单元。

立即数:则编码中应有1~2字节的立即数
存储单元:只能使用直接寻址方式，位移量由disp字段给出。

四、其它指令编码格式
除上述三种编码格式外，还有一些指令的编码格式更简单。如标志位操作指令、堆栈操作指令等。这些指令的编码格式一般只有一个字节。

在有些单字节指令的编码中，将该字节划出部分位作为REG字段。例如PUSH指令，若压入堆栈的是通用寄存器，则编码格式为:

若压栈的是段寄存器则编码格式为:

第四章.汇编语言程序格式

一.汇编语言语句种类及其格式

汇编语言的语句可以分为指令语句和伪指令语句

一.指令语句
每一条指令语句在汇编时都要产生一个可供CPU执行的机器目标代码,它又叫可执行语句。
指令语句的一般格式为:

1.标号字段
标号是可选字段，它后面必须有“:”。标号是一条指令的符号地址，代表了该指令的第一个字节存放地址。
标号一般放在一个程序段或子程序的入口处,控制程序的执行转到该程序位置。
在转移指令或子程序调用指令中，可直接引用这个标号。
2.指令助记符字段
该字段是一条指令的必选项，它表示这条语句要求CPU完成什么具体操作，如MOV、ADD, SHL等。
有些指令还可以在指令助记符的前面加上前缀，实现一定的附加操作。如串操作指令前所加的重复前缀REP等。
3.操作数字段
一条指令可以有一个操作数、两个操作数或者无操作数。
如ADD,MOV指令需要两个操作数,INC,NOT指令只需一个操作数，而CLC指令不需要操作数。
4.注释字段
注释字段为可选项，该字段以分号“;”开始。
它的作用是为阅读程序的人加上一些说明性内容.
注释字段不会产生机器目标代码，它不会影响程序和指令的功能。
注释字段可以是一条指令的后面部分，也可以是整个语句行。
二.伪指令语句
伪指令语句又叫命令语句。
伪指令本身并不产生对应的机器目标代码。它仅仅是告诉汇编程序对其后面的指令语句和伪指令语句的操作数应该如何处理。
一条伪指令语句可以包含四个字段。如下所示:

1.符号名字段
该字段为可选项。根据伪指令的不同，符号名可以是常量名、变量名、过程名、结构名和记录名等等。
一条伪指令语句的符号名可以作其它伪指令语句或指令语句的操作数，这时它表示一个常量或存储器地址

注意:符号名后面没有冒号，这是与指令语句的重要区别。

2.伪指令符字段
该字段是伪指令语句的必选项，它规定了汇编程序所要完成的具体操作。
3.操作数字段
该字段是否需要，以及需要几个是由伪指令符字段来决定。
操作数可以是一个常数（二进制、十进制、十六进制等）、字符串、常量名、变量名、标号和一些专用符号（如BYTE,FAR,PARA等）。
4.注释字段
注释字段为可选项,该字段必须以分号开始。其作用与指令语句的注释字段相同。
三.标识符
指令语句中的标号和伪指令语句中符号名统称为标识符。标识符是由若干个字符构成的。标识符构成规则:
1.字符的个数为1~31个;
2第一个字符必须是字母、问号、@或下划线“”这4种字符之一;
3.从第二个字符开始，可以是字母、数字@、“”或问号“?”;
4.不能使用属于系统专用的保留字。

保留字：

二.汇编语言数据
数据是指令和伪指令语句中操作数的基本组成部分。一个数据由数值和属性两部分构成。
在说明数据时不仅要指定其数值,还需说明它的属性，比如是字节数据还是字数据。
在汇编语言中常用的数据形式有:常数、变量和标号。

一.常数
1.二进制数：以字母B结尾
2.八进制数：以字母O或Q结尾
3.十进制数：D
4.十六进制数：以字母H结尾，如果常数的第一个数字为字母,为了与标识符加以区别，必须在其前面冠以数字“0”
5.实数:一般格式为：

汇编程序在汇编源程序时，可以把实数转换为4字节、8字节或10字节的二进制数形式存放。
6.字符串常数:用引号（单引号或双引号）括起来的一个或多个字符，这些字符以它的ASCII码值存储在内存。
常数在程序中可以用在以下几种情况:

(1）作指令语句的源操作数
(2）在指令语句的直接寻址方式变址（基址）寻址方式或基址变址寻址方式中作位移量。
(3）在数据定义伪指令中使用DB10H
二.变量
变量用来表示存放数据的存储单元，这些数据在程序运行期间可以被改变。
程序中以变量名的形式来访问变量，因此，可以认为变量名就是存放数据的存储单元地址。
1.变量的定义与预置
定义变量就是给变量在内存中分配一定的存储单元。也就是给这个存储单元赋与一个符号名，即变量名，同时还要将这些存储单元预置初值。

当变量被定义后，就具有了以下三个属性:
(1）段属性
它表示变量存放在哪一个逻辑段中。
(2）偏移量属性
它表示变量所在位置与段起始点之间的字节数。
段属性和偏移量属性就构造了变量的逻辑地址

(3)类型属性
它表示变量占用存储单元的字节数。其中DB伪指令定义的变量为字节，DW定义的变量为字，DD定义的为双字（4字节)，DQ定义的为4字，DT定义的为5字。
在变量的定义语句中，给变量赋初值的表达式可以使用下面4种形式:
(1）数值表达式
(2)?表达式
不带引号的问号“?”表示可以预置任意内容。
(3）字符串表达式
对于DB伪指令，字符串为用引号括起来的不超过255个字符。给每一个字符分配一个字节单元。字符串按从左到右，将字符的ASCII编码值以地址递增的排列顺序依次存放。

对于DD伪指令，只能给两个序符组成的字符串分配4个字节单元。
两个字符存放在较低地址的两个字节单元中。存放顺序与DW伪指令相同，而较高地址的两个字节单元存放0.
注意:DW和DD伪指令不能用两个以上字符构成的字符串赋初值,否则将出错。

(4)DUP表达式
DUP称为重复数据操作符。
使用DUP表达式的一般格式为:

2.变量的使用
(1）在指令语句中引用
在指令语句中直接引用变量名就是对其存储单元的内容进行存取
(2）在伪指令语句中引用
后面三条伪指令的操作数中都包含了前面定义的两个变量
取变量段基值和偏移量。前两个字节存偏移量,后两个字节存段基值
三.标号
标号写在一条指令的前面，它就是该指令在内存的存放地址的符号表示，也就是指令地址的别名。
标号主要用在程序中需要改变程序的执行顺序时，用来标记转移的目的地，即作转移指令的操作数。

每个标号具有三属性
（1）段属性:它表示该标号所代表的地址在哪个逻辑段中，即段基值。
（2）偏移量属性:它表示该标号所代表的地址在段内与段起点间的字节数，即地址的偏移量。
（3）距离属性（也叫类型属性):它表示该标号可以被段内还是段间的指令调用。
NEAR（近):该标号只能作段内转移，也就是说只能
是与该标号所指指令同在一个逻辑段的转移指令和调用指令才能使用它。
FAR（远）:该标号可以被非本段的转移和调用指令使用。标号的距离属性可以有两种方法来指定:
a.隐含方式
当标号加在指令语句前面时，它隐含为NEAR属性。
b.用LABEI)伪指令给标号指定距离属性
格式:标号名LABEL类型
类型为NEAR或FAR。该语句应与指令语句连用。

三.符号定义语句
在源程序设计中，使用符号定义语句可以将常数或表达式等内容用某个指定的符号来表示。在8086/8088汇编语言中有两种符号定义语句。
1.等值语句
语句格式:符号名 EQU 表达式
功能:用符号名来表示EQU右边的表达式。后面的程序中一旦出现该符号名，汇编程序将把它替换成该表达式。
表达式可以是任何形式，常见的有以下几种情况。
（1）常数或数值表达式
（2）地址表达式
（3）变量、寄存器名或指令助记符

注意:在同一源程序中，同一符号不能用EQU定义多次。

2.等号语句
格式:符号名=表达式
等号语句与等值语句具有相同的作用。但等号语句可以对一个符号进行多次定义。

注意:等值语句与等号语句都不会为符号分配存储单元。因此所定义的符号没有段、偏移量和类型等属性。

四.表达式与运算符
一.算术运算符:

1.运算符“+”和“”也可作单目运算符，表示数的正负。
2.使用“+"、“-”、“*”、和“/"运算符时,参加运算的数和运算结果都是整数。
3.“/运算为取商的整数部分，而“MOD”运算取除法运算的余数。
4."SHR”和“SHL”为逻辑移位运算符
SHR为右移，左边移出来的空位用0补入。
SHL为左移，右边移出来的空位用0补入。

注意:移位运算符与移位指令区别。移位运算符的操作对象是某一具体的数（常数），在汇编时完成移位操作。而移位指令是对一个寄存器或存储单元内容在程序运行时执行移位操作。

5.下标运算符“[]”具有相加的作用
一般使用格式:表达式1[表达式2]
作用:将表达式1与表达式2的值相加后形成一个存储器操作数的地址。

二.逻辑运算符
逻辑运算符有NOT、AND、OR和XOR等四个，它们执行的都是按位逻辑运算。

三、关系运算符
关系运算符包括:EQ（等于）NE（不等于）LT（小于）LE（小于等于）GT（大于）GE（大于等于）

关系运算符用来比较两个表达式的大小。关系运算符比较的两个表达式必须同为常数或同一逻辑段中的变量。
如果是常量的比较，则按无符号数进行比较;如果是变量的比较，则比较它们的偏移量的大小。
关系运算的结果只能是真（全1）或假（全0）

四。数值返回运算符
该类运算符有5个，它们将变量或标号的某些特征值或存储单元地址的一部分提取出来。
1.SEG运算符
作用:取变量或标号所在段的段基值。
2.OFFSET运算符
该运算符的作用是取变量或标号在段内的偏移量。
3.TYPE运算符
作用:取变量或标号的类型属性，并用数字形式表示。对变量来说就是取它的字节长度。
4.LENGTH运算符
该运算符用于取变量的长度。
如果变量是用重复数据操作符DUP说明的,则LENGTH运算取外层DUP给定的值。
如果没有用DUP说明，则LENGTH运算返回值总是1。
5.SIZE运算符
该运算符只能作用于变量，SIZE取值等于LENGTH和TYPE两个运算符返回值的乘积。

五.属性修改运算符
这一类运算符用来对变量、标号或存储器操作数的类型属性进行修改或指定。
1.PTR运算符
使用格式:
类型 PTR 地址表达式
作用:将地址表达式所指定的标号、变量或用其它形式表示的存储器地址的类型属性修改为“类型”所指的值。
类型可以是BYTE、WORD、DWORD、NEAR和FAR。这种修改是临时的，只在含有该运算符的语句内有效。
2.HIGH/LOW运算符使用格式:
HIGH 表达式
LOW 表达式
这两个运算符用来将表达式的值分离出高字节和低字节。
如果表达式为一个常量，则将其分离成高8位和低8位;如果表达式是一个地址(段基值或偏移量)时，则分离出它的高字节和低字节。

注意:HIGH/LOW运算符不能用来分离一个变量、寄存器或存储器单元的高字节与低字节。

3、THIS运算符
THIS运算符一般与等值运算符EQU连用，用来定义一个变量或标号的类型属性。所定义的变量或标号的段基值和偏移量与紧跟其后的变量或标号相同。

六.运算符的优先级

汇编程序在计算表达式时，按以下规则进行运算。
（1）先执行优先级别高的运算，再算较低级别运算;
（2）相同优先级别的操作，按照在表达式中的顺序，从左到右进行;
（3）可以用圆括号改变运算的顺序。

五.程序的段结构
一.段定义伪指令
伪指令SEGMENT和ENDS用于定义一个逻辑段。使用时必须配对，分别表示定义的开始与结束。
一般格式：

段定义伪指令语句各部分的作用如下:
1.段名：
段名是由用户自己任意选定的，符合标识符定义规则的一个名称。
最好选用与该逻辑段用途相关的名称。如第一个数据段为DATA1,第二个数据为DATA2等。
一个段的开始与结尾用的段名必须一致。

2.定位类型
定位类型用于决定段的起始边界，即第一个可存放数据的位置（不是段基址）。它可以有4种取值。
（1）PAGE:表示该段从一个页面的边界开始
（2）PARA:表示该段从一个小节的边界开始
（3）WORD:表示该段从一个偶数字节地址开始，即段起始单元地址的最后一位二进制数一定是0。
（4）BYTE:表示该段起始单元地址可以是任一地址值。

注意:定位类型为PAGE和PARA时，段起始地址与段基址相同。定位类型为WORD和BYTE时，段起始地址与段基址可能不同。

3.组合类型
组合类型说明符用来指定段与段之间的连接关系和定位。它有六种取值选择。
（1）若未指定组合类型，表示本段与其它段无连接关系。在装入内存时，本段有自己的物理段，因此有自己的段基址
（2）PUBLIC:在满足定位类型的前提下，将与该段同名的段邻接在一起，形成一个新的逻辑段，共用一个段基址。段内的所有偏移量调整为相对于新逻辑段的段基址。
（3）COMMON:产生一个覆盖段。在多个模块连接时，把该段与其它也用COMMON说明的同名段置成相同的段基址，这样可达到共享同一存储区。共享存储区的长度由同名段中最大的段确定。
（4）STACK:把所有同名段连接成一个连续段，且系统自动对SS段寄存器初始化为该连续段的段基址。并初始化堆栈指针SP。

用户程序中应至少有一个段用STACK说明,否则需要用户程序自己初始化SS和SP。

（5）AT表达式:表示本段可定位在表达式所指示的小节边界上。表达式的值也就是段基值。
（6）MEMORY:表示本段在存储器中应定位在所有其它段之后的最高地址上。如果有多个用MEMORY说明的段，则只处理第一个用MEMORY说明的段。其余的被视为COMMON。

4.类别名：类别名为某一个段或几个相同类型段设定的类型名称。系统在进行连接处理时，把类别名相同的段存放在相邻的存储区，但段的划分与使用仍按原来的设定。

类别名必须用单引号引起来。所用字符串可任意选定，但它不能使用程序中的标号、变量名或其它定义的符号。
在定义一个段时,段名是必须有的项,而定位类型、组合类型和类别名三个参数是可选项。各个参数之间用空格分隔。各参数之间的顺序不能改变。

二.段寻址伪指令
段寻址伪指令ASSUME的作用是告诉汇编程序,在处理源程序时，定义的段与哪个寄存器关联。
ASSUME并不设置各个段寄存器的具体内容，段寄存器的值是在程序运行时设定的。
一般格式：

其中段寄存器名为CS,DS,ES和SS四个之一，段名是用SEGMENT/ENDS伪指令定义的段名。

在一个代码段中可以有几条ASSUME伪指令，对于前面的设置，可以用ASSUME改变原来的设置。
一条ASSUME语句不一定设置全部段寄存器，可以选择其中一个或几个段寄存器。
可以使用关键字NOTHING将前面的设置删除。

三.段寄存器的装入
1.DS和ES的装入
在程序中，使用数据传送语句来实现对DS和ES的装入。
2.SS的装入
SS的装入有两种方法
（1）在段定义伪指令的组合类型项中，使用STACK参数，并在段寻址伪指令ASSUME语句中把该段与SS段寄存器关联。
（2）如果在段定义伪指令的组合类型中，未使用STACK参数，或者是在程序中要调换到另一个堆栈，这时，可以使用类似于DS和ES的装入方法。
3.CS的装入
装入CS和IP一般有下面两种情况。
（1）由系统软件按照结束伪指令指定的地址装入初始的CS和IP
任何一个源程序都必须以END伪指令来结束。
（2）在程序运行期间,当执行某些指令时,CPU自动修改CS和IP，使它们指向新的代码段。

六.过程定义伪指令

在程序设计过程中，常常将具有一定功能的程序段设计成一个子程序。在MASM宏汇编程序中，用过程来构造子程序。
过程名是子程序的名称，它被用作过程调用指令CALL的目的操作数。它类同一个标号的作用。具有段、偏移量和距离三个属性。而距离属性使用NEAR和FAR来指定，若没有指定，则隐含为NEAR。
NEAR过程只能被本段指令调用，而FAR过程可以供其它段的指令调用。
每一个过程中必须包含有返回指令RET,其作用是控制CPU从子程序中返回到调用该过程的主程序。

七.当前位置计数器与定位伪指令

汇编程序在汇编源程序时，每遇到一个逻辑段，就要为其设置一个位置计数器，它用来记录该逻辑段中定义的每一个数据或每一条指令在逻辑段中的相对位置。
在源程序中，使用符号S来表示位置计数器的当前值。因此，S被称为当前计数器。它位于不同的位置具有不同的值。
位置计数器S在使用上完全类似变量的使用。
定位伪指令ORG：用来改变位置计数器的值
格式：ORG 数值表达式
作用：将数值表达式的值赋给当前位置计数器$。ORG语句为其后的数据或指令设置起始偏移量。

八.标题伪指令TITLE
语句格式:
TITLE 标题名
作用:给所在程序指定一个标题。以便在列表文件的每一页的第一行都显示这个标题。其中标题是用户任意选用的字符串，字符个数不能超过60。

九.从程序返回操作系统的方法
一.使用程序段前缀PSP实现返回

为了使程序执行完后，正确返回DOS，需要以下三个操作：
1.将用户程序编制成一个过程,类型为FAR;
2.将PSP的起始逻辑地址压栈,即将INT20HI指令的地址压栈;
3.在用户程序结尾处,使用一条RET指令。执行该指令将使保存在堆栈中的PSP的起始地址弹出到CS和IP中。
二.使用DOS系统功能调用实现返回
执行DOS功能调用4CH，也可以控制用户程序结束，并返回DOS操作系统。
在程序结束时，使用两条指令:

代码段的结构为：