汇编语言(王爽第三版)实验5 编写、调试具体多个段的程序

实验5 编写、调试具体多个段的程序

一。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。

assume cs:code,ds:data,ss:stack

data segment

        dw 0123h,0456h,0789h,0abch,0defh,0fedh,0cbah,0987h

data ends

stack segment

        dw 0,0,0,0,0,0,0,0

stack ends

code segment

start:  mov ax,stack

        mov ss,ax

        mov sp,16

        mov ax,data

        mov ds,ax

        push ds:[0]

        push ds:[2]

        pop ds:[2]

        pop ds:[0]

        mov ax,4c00h

        int 21h

code ends

end start

程序分析:由于是初次接触,我们逐步讲解,废话多点。

(1)此程序考察的是内存中数据段和栈段的定义。

       程序共定义了1个数据段,data段,首先明确,在程序运行开始(标号start处),这个数据段就已经被定义好了,并且分配了内存空间,并赋值了。

       一个栈段,stack。同理这个数据段在没有被人工定义为栈结构时,也被定义好了。并且分配了内存空间,并赋值了。

       将此程序编译并连接后,使用debug调试,(这里需要注意,以下的段地址可能由于系统不同而有差异,主要是理解概念。)

E:\assembly>debug eee.exe

-r

AX=0000  BX=0000  CX=0042  DX=0000  SP=0000  BP=0000  SI=0000  DI=0000

DS=0B55  ES=0B55  SS=0B65  CS=0B67  IP=0000   NV UP EI PL NZ NA PO NC

0B67:0000 B8660B        MOV     AX,0B66

程序分析:我们什么也没执行,此时我们在data段定义的数据在哪?在ds:0100H处(原来讲过,程序最开始时ds:00~ds:100H是留给程序与操作系统通讯使用的psp内存段,参见书中p92);也就是说我们在ds:100H、0B55:100H或0B65:00处可以看见这些定义的数据。见下图。

-d ds:100

0B55:0100  23 01 56 04 89 07 BC 0A-EF 0D ED 0F BA 0C 87 09   #.V.............

0B55:0110  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................

(2)mov ax,stack

     mov ss,ax

        mov sp,16

       直到这3个指令执行完毕,此时stack数据段被人工指定为了栈结构,(ss)=offset stack,也就是说此时ss段寄存器变量才赋值为stack段的段地址。sp指针指向了栈顶。

       我们在上图中,看到SS=0B65,执行完这3个指令后,我们发现SS=0B66了,我们使用d命令查询下:

-d ss:0

0B66:0000  00 00 00 00 00 00 65 0B-00 00 0B 00 67 0B 68 05   ......e.....g.h.

       有二个事实:

       0B66:0000==0B55:0110,我们定义的数据在内存中的位置在程序装载后,位置是固定的,也就是说数据段的物理地址一直是固定的,只不过我们表述这个数据段时,采用了不同的段地址和偏移地址。

0B66:0000  00 00 00 00 00 00 65 0B-00 00 0B 00 67 0B 68 05   ......e.....g.h.

完全等价于:

0B55:0110  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................

       我们将ss指向了stack段内存,也就是说,stack这个内存段从现在开始被人工的当做了栈空间使用。在这16个字节空间里,原来都是00;为什么现在有其他数据了?这个我们先别管。它是一些其他的有用信息。

(3) mov ax,data

       mov ds,ax

       直到上面2个指令执行完毕,ds段寄存器的值才是offset data,也就是说此时ds指向了data段,ds:[0]和data:[0]是等价的。

       此时的段地址存储在ds中;也是默认的段地址寄存器;内存单元表示直接使用[idata]寻址就行,也可以使用ds:[idata]。[0]代表第一个内存单元地址;[2]代表第三个内存单元地址。

       同理:我们执行这二个指令后,将ds指向了data段。

(4) push ds:[0]

       指令含义:将data段中从第一个内存单元地址开始,按照字单元(2个字节),压栈到ss栈(或stack栈中);通俗的讲,就是将23 01这二个字节按字为单元压栈。此时sp变量有变化,原来sp=0010H(16);压栈后(sp)=(sp)-2=16-2=000EH。也就是说栈顶改变了。(这个变化,你可以使用debug中的t命令一步一步的执行后查看)。此时我们查看下栈中有变化吗?

-d ss:0

0B66:0000  00 00 00 00 65 0B 00 00-11 00 67 0B 68 05 23 01   ....e.....g.h.#.

       我们发现栈中确实存储了01 23这2个数据,而且明确了栈空间结构是从高地址向低地址发展的。至于栈中其他数据,我们不必理会。   

       push ds:[2]

       指令含义:同理,将data段中从第三个内存单元地址开始,按照字单元(2个字节),压栈到ss栈(或stack栈中);通俗的讲,就是将56 04这二个字节按字为单元压栈。此时sp变量有变化,原来sp=000EH(14);压栈后(sp)=(sp)-2=14-2=000CH。也就是说栈顶改变了SP=000C。

-d ss:0

0B66:0000  00 00 65 0B 00 00 15 00-67 0B 68 05 56 04 23 01   ..e.....g.h.V.#.

(5)pop ds:[2]

       指令含义:将栈中数据按字弹出,写入到段地址是ds(它的值是offset data或在我们的系统中是DS=0B65),偏移地址是[2]的内存单元中。如果默认段地址是ds,此指令直接可以写成:pop [2]

       指令执行后:sp值有变化,因为是弹出一个字,故(sp)=(sp)+2  =000CH+2=000EH。也就是说栈顶指针sp指向有变化了。

       这里注意栈空间中存储栈帧的顺序,也是在以后使用栈结构时候需要注意的原则:先进后出;后进先出。

       我们查看下data段数据变化。

-d ds:0

0B65:0000  23 01 56 04 89 07 BC 0A-EF 0D ED 0F BA 0C 87 09   #.V.............

其实在内存第3、4字节中是pop弹栈回写的数据。实际是没有变化,但是经过了pop的回写的。

      pop ds:[0]

    指令含义:同理如上面,不多说了。

总结:观察栈的结构,注意执行push和pop指令的汇编层面含义和CPU执行的步骤。进一步理解内存的直接寻址方式。返回前,各寄存器状态如下:   

AX=0B65  BX=0000  CX=0042  DX=0000  SP=0010  BP=0000  SI=0000  DI=0000

DS=0B65  ES=0B55  SS=0B66  CS=0B67  IP=001D   NV UP EI PL NZ NA PO NC

0B67:001D B8004C        MOV     AX,4C00

答案:

①CPU执行程序,程序返回前,data段中的数据 不变 

②CPU执行程序,程序返回前,CS=0B67,SS=0B66,DS=0B65 (根据自己系统回答)

③设程序加载后,CODE段的段地址为X,则DATA段的段地址为 X-2 ,STACK段的段地址为 X-1 

 

二。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。

assume cs:code,ds:data,ss:stack

data segment

    dw 0123h,0456h

data ends

stack segment

    dw 0,0

stack ends

code segment

start:

    mov ax,stack      

    mov ss,ax

    mov sp,16         

    mov ax,data       

    mov ds,ax

    push ds:[0]

    push ds:[2]

    pop ds:[2]

    pop ds:[0]

    mov ax,4c00h

    int 21h

code ends

end start

 

程序分析:(不再详细分析了)

       首先明确:虽然我们在data段和stack段中只定义初始化了4个字节的内存,但在汇编中,直接给你分配了16个字节的空间,不足的按00补全。

       结论:数据段和栈段在程序加载后实际占据的空间都是以16个字节为单位的。如果不足,以0补全填充。

      在debug中查看:

-d ds:100

0B55:0100  23 01 56 04 00 00 00 00-00 00 00 00 00 00 00 00   #.V.............

0B55:0110  00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00   ................    程序返回前

-t

AX=0B65  BX=0000  CX=0042  DX=0000  SP=0010  BP=0000  SI=0000  DI=0000

DS=0B65  ES=0B55  SS=0B66  CS=0B67  IP=001D   NV UP EI PL NZ NA PO NC

0B67:001D B8004C        MOV     AX,4C00  

 

答案:

(1)CPU执行程序,程序返回前,data段中的数据为多少?

       执行程序后,data段有16个字节空间,前两个字数据不变,其余为00补全了。

(2)CPU执行程序,程序返回前,CS=0B67, SS=0B66, DS=0B65.

(3)程序加载后,code段地址设为X,则data段地址为(x-2),stack段的段地址为(X-1).

(4)对于如下定义的段:

name segment

     ......

name ends

       如果段中数据位N个字节,程序加载后,该段实际占据空间为:(N/16的取整数+1)*16个字节

       如果N小于16,那么实际占用16个字节(理解这个小问题);如果N大于16,那么实际占用(N/16的取整数+1)*16个字节。其实都是这个公式。

 

三。将下面的程序编译连接,用Debug加载、跟踪,然后回答问题。

assume cs:code,ds:data,ss:stack

code segment

start:

    mov ax,stack      

    mov ss,ax

    mov sp,16         

    mov ax,data       

    mov ds,ax

    push ds:[0]

    push ds:[2]

    pop ds:[2]

    pop ds:[0]

    mov ax,4c00h

    int 21h

code ends

data segment

    dw 0123h,0456h

data ends

stack segment

    dw 0,0

stack ends

end start

程序分析:

       这次只不过是将data和stack段放到了code段后面了。那么就要注意它们段地址的变化了。

       返回前,查看

-r

AX=0B68  BX=0000  CX=0044  DX=0000  SP=0010  BP=0000  SI=0000  DI=0000

DS=0B68  ES=0B55  SS=0B69  CS=0B65  IP=001D   NV UP EI PL NZ NA PO NC

0B65:001D B8004C        MOV     AX,4C00

       总结:在汇编源代码中,我们定义的code是程序执行的代码(它存储在一个我们人为规定的段code中,在程序装载时,分配空间,并将机器码写入到这段内存中);其他的数据段(无论是逻辑上的stack段,data段等)与代码段都相邻。只不过是装载、分配内存前后的问题。

答案:

(1)CPU执行程序,程序返回前,data段中的数据为多少?

       执行程序后,data段有16个字节空间,前两个字数据不变,其余为00补全了。

(2)CPU执行程序,程序返回前,CS=0B65, SS=0B69, DS=0B68.

(3)程序加载后,code段地址设为X,则data段地址为(x+3),stack段的段地址为(X+4).

       (为什么是这样?怎么计算的?看cx,程序加载时,我们发现cx=0044,含义:此程序所有机器码占用的空间是44H=68字节,data和stack由于定义的都是小于16个字节,一律按照16个字节分配空间,其余补00;剩余的36个字节就是code段真正的可执行的机器码。由于code段不足48个字节(3*16),故程序加载时也补0了)

       我们可以使用debug看看:

       -d cs:0

0B65:0000  B8 69 0B 8E D0 BC 10 00-B8 68 0B 8E D8 FF 36 00   .i.......h....6.

0B65:0010  00 FF 36 02 00 8F 06 02-00 8F 06 00 00 B8 00 4C   ..6............L

0B65:0020  CD 21 00 00 00 00 00 00-00 00 00 00 00 00 00 00   .!..............

0B65:0030  23 01 56 04 00 00 00 00-00 00 00 00 00 00 00 00   #.V.............

0B65:0040  00 00 68 0B 68 0B 68 0B-00 00 1D 00 65 0B 68 05   ..h.h.h.....e.h.

       红色的代表了代码段。紫色代表了data段。绿色是stack段

四。 如果将(1)、(2)、(3)题中的最后一条伪指令“end start”改为“end”(也就是说不指明程序的入口),则那个程序仍然可以正确执行?请说明原因。

       答案:如果不指明程序的(code段的)入口,并且使用end替换end start,都能正常运行。但只有(3)题中程序可以正确的执行(因为只有它是在内存中可执行代码在最前面)。

       讲解:因为如果不指名入口,程序会从加载进内存的第一个单元起开始执行,前二个题中,定义的是数据,但CPU还是将数据当做指令代码执行了。只不过程序执行时逻辑上是错误了。但真的能执行的。

       如果指明了程序的入口,CPU会直接从入口处开始执行真正的机器码,直到遇到中断指令返回。此种方式能够确保程序逻辑上的正确。因此有必要为程序来指明入口。

       网上许多答案都是不太明确!

五。编写code段中的代码,将a段和b段数据依次相加,结果存入c

assume cs:code

a segment

    db 1,2,3,4,5,6,7,8

a ends

b segment

    db 1,2,3,4,5,6,7,8

b ends

c segment

    db 0,0,0,0,0,0,0,0

c ends

code segment

start:

   ???????

    mov ax,4c00h

    int 21h

code ends

end start

 

程序分析:

       (1)这个题目一下子搞出3个数据段了。呵呵,貌似我们段寄存器不够用了。cs(代码段),ss(栈段),这二个千万别碰!那只有ds和es了。思路:将a和b段我们用一个段地址表示,存储在ds中;c段我们存储在es中。?这种方式好吗?不太好。

       (2)上面已经体会了,当一个数据段不足16个字节时,按16个字节分配内存空间,其余的补0。我们发现a、b段都是定义了8个字节的数值。并且是相邻的(肯定是的),那么a段的地址我们使用[bx+idata]表示,b段我们也使用[bx+idata]表示。这种方式没有把a段和b段分开。

       (3)最终决定:将es指向c段,ds分开分别的指向a段和b段,这样我们在一个循环内完成所有的工作了;程序中使用了栈保存了ds的值;

       最终代码如下:

assume cs:code

a segment

    db 1,2,3,4,5,6,7,8

a ends

b segment

    db 1,2,3,4,5,6,7,8

b ends

cz segment

    db 0,0,0,0,0,0,0,0

cz ends

code segment

start:

    mov ax,a

    mov ds,ax            ;ds指向a段

 

    mov ax,b

    mov es,ax            ;es指向b段

 

    mov bx,0

    mov cx,8             ;计算8次,故计数器为8

s:

    mov dl, [bx]         ;将ds:[bx]内存单元按字节送入dl,此循环用到ax

    add dl, es:[bx]      ;将ds:[bx]与es:[bx]内存单元值相加

    push ds              ;保护ds值,因为下面用到ds了

    mov ax, cz          ;我的编译器不认C这个段的标号,故改成了CZ

    mov ds, ax          ;将ds指向cz段

    mov [bx], dl        ;将dl(a和b相对应内存单元内容之和)写入cz中

    pop ds               ;将ds恢复

    inc bx              ;bx递增

    loop s

   

    mov ax,4c00h

    int 21h

code ends

end start

结果分析:

       (1)ds段寄存器在程序中可以存储不同的内存段的段地址,并不是唯一存储一个段地址,es也是如此。

       (2)合理利用系统自动创建的栈空间,利用栈空间来保存暂存的数据。注意压栈和弹栈的顺序,确保操作的是一个数据对象。

       (3)在遇到多个数据段的情况下,这种方式可以利用一个段寄存器来对多个内存段寻址。

       (4)在实际工程中,在程序中保存的数据,都是程序的一些必须的初始化的数据,其他的数据都应保存在磁盘文件中,需要时才读入内存中。此例中的a、b、cz段都是其他的数据,在这里就是演示。

 

六。编写code段中代码,用push指令将a段中前8个字型数据逆序存储到b段中。

assume cs:code

a segment

    dw 1,2,3,4,5,6,7,8,9,0ah,0bh,0ch,0dh,0eh,0fh,0ffh

a ends

 

b segment

    dw 0,0,0,0,0,0,0,0

b ends

程序分析:

       (1)理解掌握栈的原理,先进后出,从高地址向低地址发展。也就是说先压栈的数据,在栈底,最后被pop出。

       (2)对于数据段,我们定义2个,ds指向a段,ss指向b。ss指向了b段,也就意味着b段是人工创建的一个栈结构了。

       (3)对于push和pop指令:操作的是一个栈帧或栈单元,它的操作数是一个字,在8086CPU中是一个字,2个字节,这个在a、b段定义时我们应该发现,它们都是定义的字。如果定义的是db字节呢?呵呵。一样的。

最终代码如下:   

assume cs:code

a segment

    dw 1,2,3,4,5,6,7,8,9,0ah,0bh,0ch,0dh,0eh,0fh,0ffh

a ends

 

b segment

    dw 0,0,0,0,0,0,0,0

b ends

code segment

start:

    mov ax,a

    mov ds,ax        ;ds指向a段

 

    mov ax,b

    mov ss,ax        ;ss指向了b段

    mov sp,16        ;初始化栈顶,ss:sp指向了栈顶,意味着b段是个栈结构了。

 

    mov bx,0

    mov cx,8         ;循环读取a段8次,因为是前8个字

s:

    push ds:[bx] ;直接将a段中的字单元内存压栈即可。这样在栈中的存储结构就是逆序的

    add bx,2

    loop s

 

    mov ax,4c00h

    int 21h

code ends

end start

运行结果debug

-d ds:0

0B65:0000  01 00 02 00 03 00 04 00-05 00 06 00 07 00 08 00   ................

0B65:0010  09 00 0A 00 0B 00 0C 00-0D 00 0E 00 0F 00 FF 00   ................

0B65:0020  08 00 07 00 06 00 05 00-04 00 03 00 02 00 01 00   ................

posted @ 2017-05-21 08:47  筑基2017  阅读(2631)  评论(0编辑  收藏  举报