16位汇编语言第二讲系统调用原理,以及各个寄存器详解

   16位汇编语言第二讲系统调用原理,以及各个寄存器详解

昨天已将简单的写了一下汇编代码,并且执行了第一个显示到屏幕的helloworld

问题?

  helloworld怎么显示出来了.

一丶显卡,显存的概念

1.显示hello就要操作显示器,这是非常原始的,那个时候的程序员,并没有像现在的RGB(红绿蓝)这样的三色真彩色,那个时候就是操作显卡的,定义了一个标准

这个标准就是我们要往固定的地址写入数据,就会显示出来

具体流程

操作显卡 -> 显卡有自己的缓存 -> 把数据写入到显存中, - > 显示数据 (显示到屏幕上)

但是那个时候是没有字的,所以就开始造字,那个时候就是把英文的26的英文字母做出来颜色都是一样的

比如 我们造一个1,并且把它放到显存中

0 0 1 0 0

0 0 1 0 0   把这个1看做是一个二维数组,把这块数据放到显存中就会显示1了.

0 0 1 0 0 

二丶锯齿的概念

我们发现,很多游戏中都有一个选项,叫做坑锯齿

其实锯齿是因为,以前做 1的时候,颜色就是黑白的 这样的字就有一点点的齿痕.看着不舒服,所以后边,就用三色,把和一个字相同颜色的都放在一起

这样看的字就很平滑,很好看.

可以看出,我写了一个 1字,放大后旁边的像素有蓝色的,红色的黄色的等等,而以前的就是黑色一种,所以看着很难看.

三丶系统调用原理

比如我们想显示一个字符串,直接 "hello"双引号包含起来,给操作系统即可.就会显示了.

那么原理是什么.

  第一讲中,说了一个指令字典,里面有功能号 int 21代表我们要调用那一项,而硬件是提供了一个表格,调用的时候直接查表

这个表格是函数指针数组,直接调用即可.

例如

但是我们会想,操作系统会调用这第21项显示数据,那么这个表可能是无限的大的吗,而操作系统提供的api就要好几万个,怎么一个表够用吗

所以后面有了ah寄存器传参,上面的图可以改为

当然可能不用Switch这种低效率的语法,会做优化,但是原理就是这样,硬件厂商只提供指令,就是说我cpu一定会调用int 21指定,找到数组中的第21项

而 这个表格则是操作系统提供的.

所以现在就知道,什么是 int 21,和为什么ah给9才能显示字符串了吧.

四丶新的问题系统没有启动之前就会显示字符串

我们有没有发现,系统还没有启动之前,就会显示一段字符串,这个字符串是通过主板的bios显示的

bios是不依赖于系统的,优先于系统存在.

操作系统启动之后也可以调用

在指令字典中 

 

 在中断码中会有说,调用int 多少,参数通过什么寄存器给.等等. 他和cpu的那种表是不一样的,但是都存在于操作系统启动之前.

五丶寄存器详解

1.IP指令寄存器

IP寄存器,上一讲说过,IP寄存器适合CS段寄存器一起使用的,IP是偏移(ip寄存器叫做指令寄存器) 他是表示通过cs段寄存器 + IP的偏移,来确定下一条指令执行的位置

比如我们有一段汇编代码

下一条指令执行的执行的位置是0100 ip就等于0100,可以用p指令查看. 其实ip等于0100是代表ip的偏移是0100,用cs段寄存器 * 16 + ip的偏移,就等于实际物理地址(也就是下一条指定指令的位置)也就是 mov ax,1

p指令调试查看

第一次

第一指令位置的偏移是0103 也就是 mov bx,2会开始执行,下面一次类推(不懂段寄存器,下面细讲)

2.Flag标志寄存器

标志寄存器的好的博客简介连接  https://my.oschina.net/clownfish/blog/142328

上一讲也说了flag标志寄存器释放各种标志的, flag标志器是16位

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
        OF DF IF TF SF ZF   AF   PF   CF

通常标志器是9个,常用的有6个,不常用的有三个,说下不常用的吧 DF IF TF,其余就是常用的了

CF 进位标志( Carry Flag) :

当我们做加法运算的时候,比如两数相加 结果是否进位了

进位的时候,标志就是1,否则标志就是0,如果是加法运算,那么标志位1代表进位,如果为减法,那么标志为借位

比如 3AH + 7CH = B6H (h在汇编中代表前边的数字是16进制) 没有进位CF = 0

AAH + 7CH = (1) 26H,最高位进位了,CF = 1

 

ZF 零标志(Zero Flag):

表示你运算的结果为0,则ZF = 1,如果不为零则ZF = 0

例子:  

  3AH + 7CH = B6H,结果不为零,ZF = 0

  84H + 7CH = (1) 00H,结果是0,因为进位了,那么CF = 1

SF 符号标志位(sign flag):

表示运算的结果,最高位为1,则SF为1,否则最高位不为1 SF = 0

3AH + 7CH = B6H,结果的最高位不为零,以为B看做二进制的则是 1 0 1 1 最高位是1所以 SF = 1

84H + 7CH = (1) 00H,结果是0,最高位是0

PF 奇偶标志位 (Parity Flag)

表示你运算的结果中,统计1出现的个数(二进制的统计)如果1的个数为零,或者偶数的时候,则PF = 1,奇数则是0

比如

3AH + 7CH = B6H, = 1011 0110 B(后缀B代表二进制的意思) 统计个数,出现了五个1则PF = 0;

 OF 溢出标志位(OverFlow Flag)

若运算结果有溢出(或者结果不正确)则OF = 1,否则OF = 1

比如

3AH + 7CH = B6H 产生了溢出, OF = 1

AAH + 7CH = (1) 26H,进位了,但是没有溢出,OF = 0

1.溢出

  在8位表达的整数返回的时候 是+127 -> -128

  在16位表达的范围内是: +32767~ -32768

  比如 3AH + 7CH = B6H,在八位范围中 3A = 10进制的58 7C = 十进制的124 

  那么结果就是58 + 124 = 182,远远超过了128的范围,所以产生了一出,并一方面

  B6H的结果变成补码,其值就是-74,显然结果也是不正确的

2.溢出和进位的不同

  溢出标志OF,和进位标志CF是不同的,

极为标志表示无符号数运算的记过是否超出范围,其运算结果仍然正确

溢出标志表示有符号数的运算结果是否超出了范围,运算的结果已经是不正确了.

3.如何运用溢出和进位

这个取决于程序员

当处理器对两个操作数进行运算的时候,会按照无符号的数据求得结果(为什么是无符号,因为负数有补码)

并且设置进位标志位CF,同事,根据是否超出有符号数的范围设置一处标志OF,也就是说也会设置进位,也会设置溢出标志位,设置溢出标志位的原因是无符号数已经超过了范围了.

利用那个标志取决于程序员自己决定

 4.溢出的原理判断

简而言之就是 正数加正数等于正数,但是此时结果的二进制最高位为1(1是负数的意思)那么计算机就认为产生了一出

AF 辅助进位标志(Auxiliary Carry Flag)

辅助标志位主要表示的是低4个的进位或者借位,和CF不同,CF是八位产生进位和借位才会设置标志位

所以这个为辅助进位标志位

比如:

3AH + 7CH = B6H,低四位有进位,则AF = 1

DF 方向标志位(Direction Flag)

比如我们的SI 和DI 变址寄存器如果要memcpy的时候,内存会增加或者减少.

DF就是控制地址的变化的方向的

DF = 0,则存储器地址自动增加

DF = 1,则存储器的地址自动减少

汇编中的CLD指令,表示复位方向标志,让其DF = 0,地址自动增加

汇编中的STD指令,表示置位方向标志,DF = 1,表示地址曾东减少.

IF 中断允许标志(Interrupt - enable Flag)

官方语言: 用于控制外部可屏蔽中断是否可以被处理器响应

自己理解的

比如键盘按下,怎么知道按下的,以前是无限循环,但是效率特别低,现在改成了键盘按下就会像CPU发送一个信号

CPU正在执行指令的时候,你按了一下键盘,会先放弃当前指令,去执行键盘发送过来的按键指令,但是如果我们一直按着键盘不放,是不是当前的指令就执行不了了,所以我们设置标志即可屏蔽当前发送过来的指令

汇编指令 CLI指令复位中断标志IF = 0;

汇编指令 STI指令置为中断标志: IF = 1

IF = 1,则代表我们可以允许中断(也就是屏蔽指令)

IF = 0,则IF 禁止中断

TF 陷阱标志(Trap Flag)

用于控制处理器进入单步操作方式(一般调试器才会用到)

TF = 0,处理器正常工作

TF = 1,处理器单步执行指令

利用这个标志,可以对程序进行逐条指令的调试.

这种逐条指令的调试程序的方法就是单步调试,

没有汇编指令,如果设置,则用 位运算 | 上即可.

 二丶段寄存器以及存储器

1.存储器和段寄存器

简而言之

  说的就是寄存器是cpu内部的内存

  内存可以存放外部数据

  硬盘可以存放外部数据,断电后还会存在

2.数据的表达单位

  二进制 bit 0 1 组成

  字节 byte 8个bit位组成

  字 word 16位 : 2个字节组成

  双字DWord 32位,两个字组成

分为大端模式存储,和端模式存储

官方语言是 LSB,MSB等等.小尾方式,和大尾方式

大端模式:  低位放低位地址,高位放到高位地址

低地址 - -------- 高地址 (比如存放1 2 3 4)

0x1  0x2   0x3  0x4

小端模式

低位放高地址,高位放低地址

低地址 - -------- 高地址 (比如存放1 2 3 4)

0x4 0x3 0x2 0x1

3.存储单元和存储内容

 每个存储单元都有一个地址编号,被称为存储器的地址,在C语言中其实就是内存地址

每个存储单元都存放了一个字节的内容.

如果取内容则是

[地址] = 取出来的值,所以C语言中的数组的中括号就是这样来的.

 4.解决CP的寻址能力

16位处理器,能处理最大的数据范围是2^16次方数据,也就是64k,就算你装上一个1MB的内存也访问不到

解决:

  1.8086CPU有20条地址线,最大的可寻址的控件是2 ^20次方,威力地址从00000h - FFFFFh

  2.8086CPU讲1MB的空间分为了很多逻辑段(Segment)

    每个段的最大限制为64kb,为什么,因为寄存器是16位了,没次寻址都是2 ^16次方

    短地址的低四位为0000b,为什么,因为加了4根地址总线,也就是多了4个,所以都给4

 这样,一个存储单元,除了有一个唯一的物理地址,还有很多的逻辑地址

现在为了解决这个寻址问题,所以用2个寄存器存储,也就是上面为什么说CS和IP一起来确定一条物理内存执行

的下一条指令了.

而逻辑地址有很多,分了好几段,也就是段地址了, 采用段基地址 : 段内偏移地址 这样存储

段地址: 段地址就是逻辑地址在主存的起始位置

  8086规定段的地址必须是%16, 那么地址就是xxxx0H,因为是16进制,所以最后为0,换算成二进制就是后面4个二进制为0

  因为%16地址,所以现在就能用16位的段寄存器来表示段地址了.

偏移地址

  偏移地址说明主存单元距离段地址起始位置的偏移量

  每段也是不超过64kb,也可以用寄存器存储,所以 IP就出现了

 物理地址和逻辑地址的转换

讲逻辑地址(段地址)左移4位(也就是 *2^4次方)加上偏移的地址,就得到了20位的物理地址

一个物理地址可以有多个逻辑地址

比如

逻辑地址 1460 : 100 物理地址就是14600 (因为*16) + 上偏移100 = 14700H

1380: F00  = 13800 + F00 = 14700H

 

 8086中常用的段寄存器

 CS(代码段) 指定代码段的起始地址

SS (堆栈段) 指明了对斩断的起始地址

DS (数据段) 指明了数据段的起始地址

ES(附加段) 指明了附加端的起始地址

而这些在C语言中称为内存4区

为什么分段:

  我们上一讲写的显示Helloworld并且写到文件中,现在汇编的代码和数据是在一起的,但是一旦程序更大了,就不好弄了.

作业: 使用debug编译器,利用指令,查看标志位的状态显示分别是什么

第二讲作业以及工具获取连接

链接:http://pan.baidu.com/s/1mi3KW1U 密码:0u0e

posted @ 2017-08-29 00:34  iBinary  阅读(2099)  评论(3编辑  收藏  举报