汇编代码 分析实践 分析指定内存地址的信息 8086汇编分享

浅谈函数调用! https://mp.weixin.qq.com/s/JpV3KF2aFTDaUN7i_3UdvA

 

浅谈函数调用!

图片

 

导语 |  在任意一门编程语言中,函数调用基本上都是非常常见的操作;我们都知道,函数是由调用栈实现的,不同的函数调用会切换上下文;但是,你是否好奇,对于一个函数调用而言,其底层到底是如何实现的呢?本文讲解了函数调用的底层逻辑实现。

 

一、汇编概述

 

既然要讲解函数调用的底层逻辑实现,那么汇编语言我们是绕不过的。

 

因此,首先来复习一下汇编相关的知识。

 

我们都知道,计算机只能读懂二进制指令,而汇编就是一组特定的字符,汇编的每一条语句都直接对应CPU的二进制指令,比如:mov rax,rdx就是我们常见的汇编指令。

 

汇编语言就是通过一条条的 助记符+操作数实现的,并且汇编指令经过汇编器(assemble,例如Linux下的as)转变为实际的CPU二进制指令。

 

 

(一)一个简单的汇编例子

 

上面讲的有些空洞,来看一个实际的例子:

 

; 将寄存器rsp的值存储到寄存器rbp中mov rbp, rsp
; 将四个字节的4存储到地址为rbp-4的栈上mov DWORD PTR [rbp-4], 4
; 将rsp的值减去16sub rsp, 16

 

需要注意的是:汇编语言是和实际底层的CPU息息相关的;上面的汇编格式使用的便是Intel的语法格式。

 

常见的汇编语言有两种截然不同的语法:

 

  • Intel格式:optcode destination,source,类似于语法int i=4。

 

  • AT&T格式:optcode source,destination,直观理解为move from source to destination。

 

若将上面的Intel汇编改写为AT&T汇编,则为:

 

movq %rsp, %rbp
movl $4, -4(%rbp)
subq $16, %rsp

 

可以看到,AT&T汇编的另外一个特点是:有前缀和后缀。

 

比如:前缀%,$;后缀q,l等等。

 

这些前缀后缀有特殊的意思,后文会讲解,不同的格式侧重点不太一样。

 

 

(二)常用汇编指令

 

下面是一些非常常用的汇编指令,在后文中都会用到:

 

图片

 

 

二、通用寄存器概述

 

对于汇编语言,仅仅了解其语法内容是远远不够的!

 

由于汇编语言和CPU是息息相关的,因此在硬件层面我们还需要关注CPU的通用寄存器。

 

在所有CPU体系架构中,每个寄存器通常都是有建议的使用方法的,而编译器也通常依照CPU架构的建议来使用这些寄存器,因而我们可以认为这些建议是强制性的。

 

(一)8086架构(16bit)

 

让我们把视线首先转移到8086

 

下图展示了在8086 CPU中的各个寄存器:

 

图片

 

主要包括下面几类寄存器:

 

  • 通用寄存器:均可用来存放地址和数据。

 

  • 指针和变量寄存器:用来存放,某一段内地址偏移量,用来形成操作数地址,主要用来再堆栈操作或者变址操作中使用。

 

  • 段寄存器:由于存储器空间是分段的,所以这些段寄存器则是每个段的首地址。

 

  • 指令指针:IP用来存放将要执行的下一条指令再现在代码段的偏移量,将这个偏移量+段寄存器中存放的基地址,就找到了下一条指令的地址。

 

  • 标志位寄存器:用来存放计算结果的特征,这些标志位常常被用作接下来程序运行的条件。

 

  • 8086处理器内部有8个16位的通用寄存器,也就是CPU内部的数据单元,分别是:AX、BX、CX、DX、SP、BP、SI、DI。

 

这些寄存器的作用主要是:暂存计算机过程中的数据。

 

另外,AX、BX、CX、DX这四个寄存器又可以分为两个8位的寄存器来使用,分别是AH、AL、BH、BL、CH、CL、DH、DL。

 

注意:其中H表示高位(high),L表示低位(low)的意思。

 

下面来看下控制单元:

 

IP寄存器就是指令指针寄存器(Instruction Pointer Register),指向代码段中下一条指令的位置;CPU会根据它不断地从内存的代码段中取出指令并加载到CPU的指令队列中,然后交给运算单元去执行。CS、DS、SS、ES这四个寄存器都是16位寄存器,用来存储进程的地址空间信息。

 

比如:

 

  • CS是代码段寄存器(Code Segment Register),通过它可以找到代码在内存中的位置。

 

  • DS是数据段寄存器(Data Segment Register),通过它可以找到数据在内存中的位置。

 

  • SS是栈寄存器(Stack Register),栈是程序运行过程所需要的一种数据结构,主要用于记录函数调用的关系。

 

  • ES是一个附加段寄存器(Extra Segment Register),当发现段寄存器不够用的时候,你可以考虑使用ES段寄存器。

 

如何根据上述段寄存器找到所需的地址呢?

 

CS和DS中都存放着一个段的起始地址,代码段的偏移值存放在IP寄存器中,而数据段的偏移值放在通用寄存器中;由于8086架构中总线地址是20位的,而段寄存器和IP寄存器以及通用寄存器都是16位的,所以为了得到20位的地址,先将段寄存器中起始地址左移4位,然后再加上偏移量,就得到了20位的地址;也正是由于偏移量是16位的,所以每个段最大的大小是64K的。

 

另外,对于20位的地址总线来说,能访问到的内存大小最多也就只有2^20=1MB。

 

如果计算得到某个要访问的地址是1MB+X,那么最后访问的是地址X,因为地址线只能发送低20位的。

 

  • 关于标志位

 

8086CPU设置了一个:16位标志寄存器PSW(也叫FR),其中规定了9个标志位,用来存放运算结果特征和控制CPU操作。

 

图片

 

9个标志位可以分为两类大类:

 

  • 条件码

 

  • 控制标志位

 

其中条件码包括:

 

  • OF(Overflow Flag)溢出标志,溢出时为1,否则置0:标明一个溢出了的计算,如:结构和目标不匹配。

 

  • SF(Sign Flag)符号标志,结果为负时置1,否则置0。

 

  • ZF(Zero Flag)零标志,运算结果为0时置1,否则置0。

 

  • CF(Carry Flag)进位标志,进位时置1,否则置0;注意:Carry标志中存放计算后最右的位;

 

  • AF(Auxiliary carry Flag)辅助进位标志,记录运算时第3位(半个字节)产生的进位置。有进位时1,否则置0;

 

  • PF(Parity Flag)奇偶标志,结果操作数中1的个数为偶数时置1,否则置0;

 

控制标志位包括:

 

  • DF(Direction Flag)方向标志,在串处理指令中控制信息的方向。

 

  • IF(Interrupt Flag)中断标志。

 

  • TF(Trap Flag)陷井标志。

 

 

(二)x86架构

 

接着,让我们步入32位机时代,来看看x86体系下的CPU寄存器:

 

图片

 

可以看到,为了使得运行在8086架构上的程序在移到32位架构之后也能执行,32位架构对8086架构进行了兼容:

 

  • 通用寄存器从16位变成了32位,也就是8个32位的通用寄存器;但是为了保持兼容,仍然保留了16位和8位的使用方式,即:AH、AL等。

 

  • 指向下一条指令的指令指针寄存器也从16位变成了32位,被称为EIP,但是同样兼容16位的使用方式。

 

  • 段寄存器改动比较大:在32位架构中段寄存器还是16位,但是它不再表示段的起始地址,而是表示索引;32位架构中,引入了段描述符表,表格中的每一项都是段描述符(Segment Descriptor),记录了段在内存中的起始位置,而这张表则存放在内存的某个地址;那么,段寄存器中存的就是对应段在段表中的位置,称为选择子(selector)。

 

关于选择子:

 

先根据段寄存器拿到段的起始地址,再根据段寄存器中保存的选择子,找到对应的段描述符,然后从这个段描述符中取出这个段的起始地址;就相当于由之前的直接找到段起始地址变成了间接找到段起始地址;这样改变之后,段起始地址会变得很灵活。

 

但是这样就跟原来的8086架构不兼容了,因此为了兼容8086架构,32位架构中引入了实模式和保存模式:8086架构中的方式就称为实模式,32位这种模式就被称为保护模式。

 

当系统刚刚启动的时候,CPU是处于实模式的,这个时候和8086模式是兼容的;当需要更多内存时,进行一系列的操作,将其切换到保护模式,这样就能使用32位了。

 

模式可以理解为:CPU和操作系统的一起干活的模式:

 

  • 在实模式下,两者约定好了这些寄存器是干这个的,总线是这样的,内存访问是这样的。

 

  • 在保护模式下,两者约定好了这些寄存器是干那个的,总线是那样的,内存访问是那样的。


这样操作系统给CPU下命令,CPU按照约定好的,就能得到操作系统预料的结果,操作系统也按照约定好的,将一些数据结构,例如段描述符表放在一个约定好的地方,这样CPU就能找到。两者就可以配合工作了。

 

下面是x86平台下一些寄存器的调用特殊约定:

 

图片

 

作为通用寄存器,过程调用中,调用者栈帧需要寄存器暂存数据,被调用者栈帧也需要寄存器暂存数据。

 

为防止调用过程中数据不会被破坏丢失,C/C++编译器遵守如下约定的规则:

 

图片

 

当产生函数调用时,子函数内通常也会使用到通用寄存器,那么这些寄存器中之前保存的调用者(父函数)的值就会被覆盖!为了避免数据覆盖而导致从子函数返回时寄存器中的数据不可恢复,CPU 体系结构中就规定了通用寄存器的保存方式。

 

如果一个寄存器被标识为Caller Save, 那么在进行子函数调用前,就需要由调用者提前保存好这些寄存器的值,保存方法通常是把寄存器的值压入堆栈中,调用者保存完成后,在被调用者(子函数)中就可以随意覆盖这些寄存器的值了。

 

如果一个寄存被标识为Callee Save,那么在函数调用时,调用者就不必保存这些寄存器的值而直接进行子函数调用,进入子函数后,子函数在覆盖这些寄存器之前,需要先保存这些寄存器的值,即这些寄存器的值是由被调用者来保存和恢复的。

 

具体来讲:

 

当该函数是处于调用者角色时,如果该函数执行过程中产生的临时数据会已存

储在%eax,%edx,%ecx这些寄存器中,那么在其执行call指令之前会将这些寄存器的数据写入其栈帧内指定的内存区域,这个过程叫做调用者保存约定(Caller Save)。

 

当该函数是处于被调用者角色时,那么在其使用这些寄存器%ebx,%esp,%edi之前,那么该函数会保存这些寄存器中的信息到其栈帧指定的内存区域,这个过程叫被调用者保存约定;%eax总会被用作返回整数值。

 

%esp,%ebp总被分别用着指向当前栈帧的顶部和底部,主要用于在当前函数推出时,将他们还原为原始值;往往会在栈帧开始处保存上一个栈帧的ebp,而esp是全栈的栈顶指针,一直指向栈的顶部。

 

注:在x86-64架构下也是类似的约定!

 

 

(三)x86-64架构

 

  • 寄存器约定

 

最后就是我们目前主流的x86-64架构了;

 

对于x86-64架构,最常用的有16个64位通用寄存器,各寄存器及用途如下所示:

 

图片

 

从上面的表可以看到,除了扩展原来存在的通用寄存器,x64架构还引入了8个新的通用寄存器:r8-r15。

 

这些寄存器虽然都可以用,但是还是做了一些规定,如下:

 

函数返回值存放的寄存器:rax。

 

  • rax同时也用于乘法和除法指令中。在imul指令中,两个64位的乘法最多会产生128位的结果,需要rax与rdx共同存储乘法结果,在div指令中被除数是128位的,同样需要rax与rdx共同存储被除数。

 

  • rsp是堆栈指针寄存器,通常会指向栈顶位置,堆栈的pop和push操作就是通过改变rsp的值即移动堆栈指针的位置来实现的。

 

  • rbp是栈帧指针,用于标识当前栈帧的起始位置。

 

  • %rdi,%rsi,%rdx,%rcx,%r8,%r9六个寄存器用于存储函数调用时的6个参数(如果有6个或6个以上参数的话)。

 

  • rbx被标识为 “miscellaneous registers”,属于通用性更为广泛的寄存器,编译器或汇编程序可以根据需要存储任何数据。

 

  • rbx、rbp、r12、r13、r14、r15:这些寄存器由被调用者负责保护,在返回的时候要恢复这些寄存器中原本的值。

 

同时,和上面x32架构类似这里也要区分Caller Save和Callee Save寄存器,即寄存器的值是由 调用者保存 还是由 被调用者保存。

 

 

  • 函数传参优化

 

在x32的时代,通用寄存器少,参数传递都是通过入栈(汇编指令push)实现的(当然也有使用寄存器传递的,比如著名的C++ this指针使用ecx寄存器传递,不过能用的寄存器毕竟不多),相对CPU寄存器来说,访问太慢,函数调用的效率就不高;

 

而在x86-64时代,寄存器数量多了,CPU就可以利用额外的寄存器rdi、rsi、rdx、rcx、r8、r9来存储参数!

 

寄存器传参的好处是速度快,减少了对内存的读写次数。

 

注:多于6个的参数,依然还是通过入栈实现传递。

 

因此在x86_64位机器上编程时,需要注意:

 

  • 为了效率尽量使用少于6个参数的函数。

 

  • 传递比较大的参数,尽量使用指针,因为寄存器只有64位。

 

注意:具体使用栈还是用寄存器传参数,这个不是编程语言决定的,而是编译器在编译生成CPU指令时决定的。如果编译器非要在x64架构CPU上使用线程栈来传参那也不是不行,这个对高级语言是无感知的。

 

 

(三)x86-64寄存器的向下兼容

 

上述的寄存器名字都是64位的名字,对于每个寄存器,我们还可以只使用它的一部分,并使用另一个新的名字:

 

图片

 

图片

 

下面这些寄存器可能也会需要用到其他寄存器:

 

  • 8个80位的x87寄存器(%st0~st7),用于浮点计算。

 

  • 8个64位的MMX寄存器,用于MMX指令(多媒体指令),这8个寄存器跟 x87寄存器在物理上是相同的寄存器。

 

  • 16个128位的SSE寄存器,用于SSE指令。

 

  • RIP指令寄存器,保存指令地址。

 

  • flags(rflags-64位,eflags-32位)寄存器。每个位用来标识一个状态。比如,这些标识符可能用于比较和跳转的指令。

 

和上面所述的x86架构类似,在x86-64架构下也存在实模式;更多关于 x86-64 处理器架构: 

http://c.biancheng.net/view/3460.html

https://www.cnblogs.com/mazhimazhi/p/15236954.html


更多关于CPU寄存器历史见:
https://zhuanlan.zhihu.com/p/272135463

 

 

三、函数调用结构

 

上文简单复习了一下汇编和寄存器相关的内容。下面来正式来看看函数调用的底层是如何实现的!

 

注:这里的说明采用的是:

 

  • 编译器:GCC 12.1。

 

  • 优化级别为-O0。

 

  • 汇编指令为intel架构。

 

(一)函数调用

 

子函数调用时,调用者与被调用者的栈帧结构如下图所示:

 

图片

 

在子函数调用时,需要切换上下文使得当前调用栈进入到一个新的执行中:

 

  • 父函数将调用参数从后向前压栈:由函数调用者完成(上文中的Caller逻辑)。

 

  • 将返回地址压栈保存:call指令完成。

 

  • 跳转到子函数起始地址执行:call指令完成。

 

  • 子函数将父函数栈帧起始地址(%rpb)压栈:由函数被调用者完成(上文中的Callee逻辑);

 

  • 将%rbp的值设置为当前%rsp的值,即将%rbp指向子函数栈帧的起始地址:由函数被调用者完成(上文中的Callee逻辑),完成函数上下文的切换。

 

保存返回地址和保存上一栈帧的%rbp都是为了函数返回时,恢复父函数的栈帧结构(保存函数调用上下文)。

 

在使用高级语言进行函数调用时,由编译器自动完成上述整个流程;甚至对于”Caller Save”和“Callee Save”寄存器的保存和恢复,也都是由编译器自动完成的。

 

需要注意的是:父函数中进行参数压栈时,顺序是从后向前进行的(调用栈空间都是从大地址向小地址延伸,这一点刚好和堆空间相反)。

 

这一行为并不是固定的,是依赖于编译器的具体实现的。

 

至少在GCC中,使用的是从后向前的压栈方式,这种方式便于支持类似于printf(“%d,%d”,i,j) 这样的使用变长参数的函数调用。

 

以下面的函数为例:


void func() {}
void my_func() { func();}

 

对应的汇编为:

 

func():        push    rbp        mov     rbp, rsp        nop        pop     rbp        retmy_func():        push    rbp        mov     rbp, rsp        call    func()        nop        pop     rbp        ret

 

在函数my_func和func中:开始的两句就是由编译器默认生成的切换上下文语句(函数my_func中也存在这个语句是因为它最终也会被其他函数s调用)。

 

当my-func函数调用func函数时:

 

  • 首先,执行call指令,保存返回地址,并跳转至func函数起始地址(这里没有压栈调用参数是因为func入参为空)。

 

  • 随后,在func函数中,使用push rbp和mov rbp,rsp保存上下文,随后开始执行func函数中的逻辑。

 

  • 由于没有代码,且没有返回值,此次为nop指令。

 

  • 最后,恢复上下文,并返回(函数返回在下文中介绍)。

 

函数开头的push rbp和mov rbp,rsp又叫做函数的序言(prologue),几乎每个函数一开始都会该指令。


它和函数最后的pop rbp和ret(epilogue)起到维护函数的调用栈的作用。

 

接下来,顺理成章的我们来看一下函数的返回过程。

 

 

(二)函数返回

 

函数返回时,我们只需要得到函数的返回值(保存在%rax中),之后就需要将栈的结构恢复到函数调用之差的状态,并跳转到父函数的返回地址处继续执行即可。

 

由于函数调用时已经保存了返回地址和父函数栈帧的起始地址,要恢复到子函数调用之前的父栈帧,我们只需要执行以下两条指令:

 

pop rbpret

 

首先执行pop rbp指令,直接将调用栈地址恢复至调用函数之前的状态。

 

随后通过ret指令跳转至返回地址处并执行。

 

 

(三)数据参数传递

 

  • 函数参数传递概述

 

在函数调用中,另一个需要关注的便是函数参数的传递:入参传递以及返回值传递。

 

函数在计算的时候,存储数据的地方总共有三个:

 

  • 寄存器;

 

  • 内存:栈空间、堆(heap)空间、静态区。

 

  • 程序本身:只读的程序数据片段,比如int i=4,这个4存储于程序本身,在汇编里面又叫立即数(immediate number)。

 

知道了数据的存储地方,那么数据的传递就分为以下四个方面:

 

  • 从内存到寄存器;

 

  • 从寄存器到内存;

 

  • 从立即数到寄存器;

 

  • 从立即数到内存。

 

注意:数据不能从内存直接传递到内存,如果需要从内存传递到内存,要以寄存器为中介!

 

同时需要注意的是:数据是有大小的!

 

比如:一个word是两个字节(16bit),double words是四个字节(32bit),quadruple words是八个字节(64bit)。

 

所以传递数据的时候,要知道传递的数据大小:

 

Intel格式的汇编会在数据前面说明数据大小:比如 mov DWORD PTR [rbp-4],4,意思是将一个4字节的4存储到栈上(地址为rbp-4)。

 

而AT&T格式是通过指令的后缀来说明,同样的指令为movl $4, -4(%rbp);并且存储的地方,AT&T汇编是通过前缀来区别,比如%q前缀表示寄存器,$表示立即数,()表示内存。

 

学习了数据的传递方式之后,让我们看看函数的调用习惯。

 

  • 函数参数传递约定

 

之前我们简单学习了一下Caller和Callee的区别,在这里我们会深入的学习。

 

首先,什么是函数调用约定?

 

在Caller调用Callee时,要将参数(arguements)传递给Callee,一个函数可以接收多个参数,而Caller与Callee之间约定的每个参数的应该怎么传递就是调用习惯;这样,Callee才能到指定的位置获取到相应的参数。

 

比如下面的代码:

 

int square(int num) {    return num * num;}
int main() { int i = 4; int j = square(i);}

 

在main函数中调用square,参数i是如何传递到square中的?

 

上面的代码对应的汇编如下:

 

square(int):        push    rbp        mov     rbp, rsp        mov     DWORD PTR [rbp-4], edi        mov     eax, DWORD PTR [rbp-4]        imul    eax, eax        pop     rbp        retmain:        push    rbp        mov     rbp, rsp        sub     rsp, 16        mov     DWORD PTR [rbp-4], 4        mov     eax, DWORD PTR [rbp-4]        mov     edi, eax        call    square(int)        mov     DWORD PTR [rbp-8], eax        mov     eax, 0        leave        ret

 

通过上面的汇编,我们可以知道:

 

在main里面,4先存到栈上(mov DWORD PTR [rbp-4],4),然后存在edi里面(mov eax,DWORD PTR [rbp-4]、mov edi,eax),而sqaure函数直接就从edi里面读取4的值了!

 

这就说明:参数4是通过寄存器edi传给了callee (sqaure) 。

 

可能有同学会以为,从代码看,参数不是直接就传给了sqaure吗?实际上,在汇编中,这个变量i是不存在的,只有寄存器和内存,因此我们需要约定好入参i的值存在哪里。

 

下面让我们来详细看看这些约定、常见寄存器负责传递的参数以及一些作用(前文简要介绍了一些):

 

图片

 

在上面的列表中:

 

  • 蓝色的是callee-owned、绿色背景的是caller-owned。

 

  • callee-owned表明:callee可以自由地使用这些寄存器,覆盖已有的值;如果caller要使用这些寄存机,那么它在调用callee前,要把这些寄存器保存好;例如:如果寄存器%rax的值caller想要保留,那么在调用函数之前,caller需要赋值这个值到“安全”的地方。

 

  • caller-owned表明:如果callee要使用这些寄存器,那么它就要保存好这些寄存器的值,并且返回到caller的时候要将这些值恢复;caller-owned的寄存器通常用于caller需要在函数之间保留的局部状态。

 

  • 一共有六个通用的寄存器用于传递参数;按顺序传递需要通用寄存器传递的参数,如果通用寄存器使用完了,那么就使用栈来传递。

 

同时,如果函数返回比较大的对象,那么第一个参数rdi会用来传递存储这个对象的地址(这个地址是由caller分配的)。

 

有了这些基础,我们就更容易理解C++中的copy elision了。

 

相关阅读:

 

  • 深入理解C++中的move和forward

 

  • Copy/move elision: C++ 17 vs C++ 11

 

 

四、常见控制结构

 

在知道了函数参数是如何传递的之后,我们来更升一级。

 

下面根据具体代码来看一看我们经常使用的if、for、while等控制结构在底层是如何实现的。

 

if,while循环等控制结构,在汇编里面,都是基于判定语句,跳转语句实现的:做一个计算,检查相应的flag,然后根据flag的值确定要跳转到哪里。

 

比如下面的if语句:

 

int multiply(int j) {    if (j > 6) {        return j*2;    } else {        return j*3;    }}

 

对应的汇编语句如下:

 

multiply(int):        push    rbp        mov     rbp, rsp        mov     DWORD PTR [rbp-4], edi        cmp     DWORD PTR [rbp-4], 6        jle     .L2        mov     eax, DWORD PTR [rbp-4]        add     eax, eax        jmp     .L3.L2:        mov     edx, DWORD PTR [rbp-4]        mov     eax, edx        add     eax, eax        add     eax, edx.L3:        pop     rbp        ret

 

最前面和最后两条命令就是函数调用中的上下文切换,这个在前文中已经详细说明了。

 

函数的逻辑从第三条语句真正开始:

 

mov DWORD PTR [rbp-4],edi表示将寄存器edi中的4个字节的值(DWORD PTR)移至 [rbp-4] 对应内存地址中。

 

这里和上面所讲述的参数传递的约定是保持一致的,因为我们的入参j是int类型,只有32位,因此使用的是edi寄存器来传递的参数。

 

随后,使用cmp指令将内存中的数和立即数6进行比较(即,j>6),此指令会改变标志寄存器%eflags的状态。

 

然后jle会利用标志寄存器%eflags中的状态进行跳转:

 

  • 如果j<=6,跳转至.L2。

 

  • 否则继续向下执行(对应j>6的场景)。

 

无论是向下执行还是跳转至.L2执行,最终两者都会执行至.L3并返回。

 

下面再来看一个for循环的例子:

 

int add(int j) {    int ret = 0;    for (int i = 0; i < j; ++i) {        ret+= i;    }    return ret;}

 

对应的汇编如下:

 

add(int):        push    rbp        mov     rbp, rsp        mov     DWORD PTR [rbp-20], edi        mov     DWORD PTR [rbp-4], 0        mov     DWORD PTR [rbp-8], 0        jmp     .L2.L3:        mov     eax, DWORD PTR [rbp-8]        add     DWORD PTR [rbp-4], eax        add     DWORD PTR [rbp-8], 1.L2:        mov     eax, DWORD PTR [rbp-8]        cmp     eax, DWORD PTR [rbp-20]        jl      .L3        mov     eax, DWORD PTR [rbp-4]        pop     rbp        ret

 

从上面的汇编我们可以看到,入参j依旧是由寄存器edi传递,并存储在了内存[rbp-20]中。

 

随后两行分别初始化了参数ret:[rbp-4]、i:[rbp-8]。

 

紧接着,指令直接跳转至.L2处,首先比较了[rbp-8]和[rbp-20]中的值(即比较i和j):如果i<j则跳转至.L3处执行。

 

这里的判断是符合for循环的逻辑的:在进入for循环之前首先会判断一次条件。

 

.L3代码块是for循环的真正逻辑:

 

; ret += i;mov     eax, DWORD PTR [rbp-8]add     DWORD PTR [rbp-4], eax
; ++iadd DWORD PTR [rbp-8], 1

 

其他控制结构的逻辑也是类似的,这里不再赘述了!

 

五、总结

 

本文首先简要复习了汇编以及通用寄存器相关的内容,随后进入到文章主题:函数调用。

 

在函数调用中讲述了函数调用中的调用和返回细节、上下文切换保护、函数传递等内容。

 

最后略微引申了函数中常见控制结构的底层实现。

 

参考资料:

1.《程序是怎样跑起来的》

2.《程序员的自我修养 : 链接、装载与库》

3.https://zhuanlan.zhihu.com/p/368962727

4.https://zhuanlan.zhihu.com/p/27339191

5.http://c.biancheng.net/view/3460.html

6.https://zhuanlan.zhihu.com/p/288636064

7.https://zhuanlan.zhihu.com/p/272135463

8.http://119.23.219.145/posts/%E8%AE%A1%E7%AE%97%E6%9C%BA%E4%BD%93%E7%B3%BB%E7%BB%93%E6%9E%84-x86-%E6%9E%B6%E6%9E%84%E7%9A%84%E8%AE%B2%E8%A7%A3/

 

 

8086汇编分享 https://mp.weixin.qq.com/s/22NH3uLaGpeoIdqEQWLL6g

8086汇编分享

陈江 好未来技术 2022-05-19 18:35 发表于北京

图片

导读

 

通过一种常用的、结构简洁的微处理器的汇编语言来进行学习,达到学习汇编的两个最根本的目的:充分获得底层编程的体验,深刻理解机器运行程序的机理。

01  学习环境安装

 

1.虚拟机安装dos系统

virtualbox+dos.iso

一个缺点是,有的软件不一定全,比如masm.exe没有这个命令。

需要打包一个 iso文件,挂载,把这个软件copy进去。

苹果打iso命令hdiutil makehybrid -o masm.iso ./mas

 

2.直接使用dosbox

缺什么就挂载到对应的磁盘下就行

 

书上的源码是可以通过这里下载:

http://www.tup.tsinghua.edu.cn/booksCenter/book_07970801.html#

 

还有一个汇编语言的论坛:

http://www.asmedu.net/bbs/forum.jsp

02  一个简单的程序

assume cs:code,ds:data,ss:stack
data segment db 'hello world' db 16 dup(0)data ends
stack segmentdb 32 dup(0)stack ends
code segment
start: mov ax, data mov ds, ax call strlen ; 字符串长度,执行完 bx 是 0BH,也就是11 call strtoupper ; 字符串转成成大写 放到 db call strrev ; 字符串翻转
mov ax,4c00h int 21h
strlen: mov bx, 0 s: mov al, ds:[bx] cmp al, 0 jne next ret next: inc bx loop s
strtoupper: mov cx, bx mov si, 0 s1: mov dl, byte ptr [si] cmp dl, 65 ; 如果大于等于 65 ,65是大写字母A,也就是不是字母不处理。 ja next1 ss1: mov byte ptr [16+si], dl inc si loop s1 ret next1: and dl,11011111b jmp ss1
strrev: mov ax, stack ;mov ss, ax mov es,ax mov cx, bx mov di, bx ;add bx, 1 ;mov sp, bx
mov si, 0 mov bx, data mov ds, bx mov bx, 16 s2: mov al, ds:[bx+si] ;mov ah, 0 mov es:[di], al ;push ax inc si dec di loop s2 retcode endsend start

 

其中 伪指令(assume、end 、segment 跟 ends是成对出现的伪指令)、汇编指令、标号(code、data、s1)

 

debug 常用的指令的放到下面列表:

图片

 

参考链接:

https://thestarman.pcministry.com/asm/debug/debug.htm

 

https://blog.csdn.net/weixin_43809545/article/details/103640185

03  通用的寄存器

 

8086CPU有14个寄存器:AX、BX、CX、DX、SI、DI、SP、BP、IP、CS、SS、DS、ES、PSW

图片

04  指令分类

图片

05  程序是如何执行的

图片

 

物理地址=段地址x16+偏移地址

 

参考书本page25

 

程序的可用段地址和偏移地址表示为:SA+10H:0 (page 92)

图片

参考书本page92

06  数据寻址与访问

图片

8086CPU可以处理两种尺寸数据,byte(字节)和word(字)。

图片

在没有寄存器参与的内存单元访问指令中,用word ptr或byte ptr显性指明所要访问的内存单元长度是很有必要的。

 

t_assembly.c

#include <stdio.h>
int f()
{
	char sa[] = "a";
	char sz[] = "z";
	char hi[] = "hi";
	int i = 6;
	int j = 10;
	unsigned k = 10;
	int ii = -6;
	int jj = -10;
	int n = -110;
	printf("hi");
	return 0;
}
int main()
{
	int im = 6;
	int jm = 10;
	unsigned k = 10;
	while (1 == 1)
	{
		f();
	}
	return 0;
}

  

gcc -g t_assembly.c

 

./a.out

perf record -a

perf report --pid=104168

 

Samples: 569K of event 'cpu-clock', 4000 Hz, Event count (approx.): 142343250000

Percent│                                                                                                                                                          ◆
       │    /root/.debug/.build-id/e9/861963f99551d49974e36550e73ccc2c63480f/elf:     文件格式 elf64-x86-64                                                      ▒
       │                                                                                                                                                          ▒
       │                                                                                                                                                          ▒
       │    Disassembly of section .text:                                                                                                                         ▒
       │                                                                                                                                                          ▒
       │    000000000040052d <f>:                                                                                                                                 ▒
       │    f():                                                                                                                                                  ▒
       │    #include <stdio.h>                                                                                                                                    ▒
       │    int f()                                                                                                                                               ▒
       │    {                                                                                                                                                     ▒
  8.56 │      push   %rbp                                                                                                                                         ▒
  2.84 │      mov    %rsp,%rbp                                                                                                                                    ▒
  0.80 │      sub    $0x40,%rsp                                                                                                                                   ▒
       │            char sa[] = "a";                                                                                                                              ▒
  6.13 │      movw   $0x61,-0x20(%rbp)                                                                                                                            ▒
       │            char sz[] = "z";                                                                                                                              ▒
 18.07 │      movw   $0x7a,-0x30(%rbp)                                                                                                                            ▒
       │            char hi[] = "hi";                                                                                                                             ▒
  6.39 │      movw   $0x6968,-0x40(%rbp)                                                                                                                          ▒
  5.19 │      movb   $0x0,-0x3e(%rbp)                                                                                                                             ▒
       │            int i = 6;                                                                                                                                    ▒
  3.98 │      movl   $0x6,-0x4(%rbp)                                                                                                                              ▒
       │            int j = 10;                                                                                                                                   ▒
  5.28 │      movl   $0xa,-0x8(%rbp)                                                                                                                              ▒
       │            unsigned k = 10;                                                                                                                              ▒
  5.59 │      movl   $0xa,-0xc(%rbp)                                                                                                                              ▒
       │            int ii = -6;                                                                                                                                  ▒
  2.84 │      movl   $0xfffffffa,-0x10(%rbp)                                                                                                                      ▒
       │            int jj = -10;                                                                                                                                 ▒
  4.41 │      movl   $0xfffffff6,-0x14(%rbp)                                                                                                                      ▒
       │            int n = -110;                                                                                                                                 ▒
  4.44 │      movl   $0xffffff92,-0x18(%rbp)                                                                                                                      ▒
       │            printf("hi");                                                                                                                                 ▒
  3.20 │      mov    $0x400650,%edi                                                                                                                               ▒
  0.23 │      mov    $0x0,%eax                                                                                                                                    ▒
  1.26 │    → callq  printf@plt                                                                                                                                   ▒
       │            return 0;                                                                                                                                     ▒
 10.59 │      mov    $0x0,%eax                                                                                                                                    ▒
       │    }                                                                                                                                                     ▒
  0.72 │      leaveq                                                                                                                                              ▒
  9.48 │    ← retq                                                                                                                                                ▒
                                      

 问题:解释 0x400650信息

 

Samples: 569K of event 'cpu-clock', 4000 Hz, Event count (approx.): 142343250000
main  /home/hdp/workbench/perfUcan/a.out [Percent: local period]
Percent│                                                                                                                                                          ◆
       │    /root/.debug/.build-id/e9/861963f99551d49974e36550e73ccc2c63480f/elf:     文件格式 elf64-x86-64                                                      ▒
       │                                                                                                                                                          ▒
       │                                                                                                                                                          ▒
       │    Disassembly of section .text:                                                                                                                         ▒
       │                                                                                                                                                          ▒
       │    000000000040058b <main>:                                                                                                                              ▒
       │    main():                                                                                                                                               ▒
       │            int n = -110;                                                                                                                                 ▒
       │            printf("hi");                                                                                                                                 ▒
       │            return 0;                                                                                                                                     ▒
       │    }                                                                                                                                                     ▒
       │    int main()                                                                                                                                            ▒
       │    {                                                                                                                                                     ▒
       │      push   %rbp                                                                                                                                         ▒
       │      mov    %rsp,%rbp                                                                                                                                    ▒
       │      sub    $0x10,%rsp                                                                                                                                   ▒
       │            int im = 6;                                                                                                                                   ▒
       │      movl   $0x6,-0x4(%rbp)                                                                                                                              ▒
       │            int jm = 10;                                                                                                                                  ▒
       │      movl   $0xa,-0x8(%rbp)                                                                                                                              ▒
       │            unsigned k = 10;                                                                                                                              ▒
       │      movl   $0xa,-0xc(%rbp)                                                                                                                              ▒
       │            while (1 == 1)                                                                                                                                ▒
       │            {                                                                                                                                             ▒
       │                    f();                                                                                                                                  ▒
 53.47 │1d:   mov    $0x0,%eax                                                                                                                                    ▒
  1.34 │    → callq  f                                                                                                                                            ▒
       │            }                                                                                                                                             ▒
 45.19 │    ↑ jmp    1d                                                                                                                                           ▒
                                                                                                                                                                  ▒
                                                                                                                                                                  ▒
                                  

  

 

 

readelf -all a.out

[hdp@cmd perfUcan]$ readelf -all a.out
ELF 头:
  Magic:  7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
  类别:                              ELF64
  数据:                              2 补码,小端序 (little endian)
  版本:                              1 (current)
  OS/ABI:                            UNIX - System V
  ABI 版本:                          0
  类型:                              EXEC (可执行文件)
  系统架构:                          Advanced Micro Devices X86-64
  版本:                              0x1
  入口点地址:              0x400440
  程序头起点:              64 (bytes into file)
  Start of section headers:          7472 (bytes into file)
  标志:             0x0
  本头的大小:       64 (字节)
  程序头大小:       56 (字节)
  Number of program headers:         9
  节头大小:         64 (字节)
  节头数量:         35
  字符串表索引节头: 34

节头:
  [号] 名称              类型             地址              偏移量
       大小              全体大小          旗标   链接   信息   对齐
  [ 0]                   NULL             0000000000000000  00000000
       0000000000000000  0000000000000000           0     0     0
  [ 1] .interp           PROGBITS         0000000000400238  00000238
       000000000000001c  0000000000000000   A       0     0     1
  [ 2] .note.ABI-tag     NOTE             0000000000400254  00000254
       0000000000000020  0000000000000000   A       0     0     4
  [ 3] .note.gnu.build-i NOTE             0000000000400274  00000274
       0000000000000024  0000000000000000   A       0     0     4
  [ 4] .gnu.hash         GNU_HASH         0000000000400298  00000298
       000000000000001c  0000000000000000   A       5     0     8
  [ 5] .dynsym           DYNSYM           00000000004002b8  000002b8
       0000000000000060  0000000000000018   A       6     1     8
  [ 6] .dynstr           STRTAB           0000000000400318  00000318
       000000000000003f  0000000000000000   A       0     0     1
  [ 7] .gnu.version      VERSYM           0000000000400358  00000358
       0000000000000008  0000000000000002   A       5     0     2
  [ 8] .gnu.version_r    VERNEED          0000000000400360  00000360
       0000000000000020  0000000000000000   A       6     1     8
  [ 9] .rela.dyn         RELA             0000000000400380  00000380
       0000000000000018  0000000000000018   A       5     0     8
  [10] .rela.plt         RELA             0000000000400398  00000398
       0000000000000048  0000000000000018  AI       5    23     8
  [11] .init             PROGBITS         00000000004003e0  000003e0
       000000000000001a  0000000000000000  AX       0     0     4
  [12] .plt              PROGBITS         0000000000400400  00000400
       0000000000000040  0000000000000010  AX       0     0     16
  [13] .text             PROGBITS         0000000000400440  00000440
       00000000000001f2  0000000000000000  AX       0     0     16
  [14] .fini             PROGBITS         0000000000400634  00000634
       0000000000000009  0000000000000000  AX       0     0     4
  [15] .rodata           PROGBITS         0000000000400640  00000640
       0000000000000013  0000000000000000   A       0     0     8
  [16] .eh_frame_hdr     PROGBITS         0000000000400654  00000654
       000000000000003c  0000000000000000   A       0     0     4
  [17] .eh_frame         PROGBITS         0000000000400690  00000690
       0000000000000114  0000000000000000   A       0     0     8
  [18] .init_array       INIT_ARRAY       0000000000600e10  00000e10
       0000000000000008  0000000000000008  WA       0     0     8
  [19] .fini_array       FINI_ARRAY       0000000000600e18  00000e18
       0000000000000008  0000000000000008  WA       0     0     8
  [20] .jcr              PROGBITS         0000000000600e20  00000e20
       0000000000000008  0000000000000000  WA       0     0     8
  [21] .dynamic          DYNAMIC          0000000000600e28  00000e28
       00000000000001d0  0000000000000010  WA       6     0     8
  [22] .got              PROGBITS         0000000000600ff8  00000ff8
       0000000000000008  0000000000000008  WA       0     0     8
  [23] .got.plt          PROGBITS         0000000000601000  00001000
       0000000000000030  0000000000000008  WA       0     0     8
  [24] .data             PROGBITS         0000000000601030  00001030
       0000000000000004  0000000000000000  WA       0     0     1
  [25] .bss              NOBITS           0000000000601034  00001034
       0000000000000004  0000000000000000  WA       0     0     1
  [26] .comment          PROGBITS         0000000000000000  00001034
       000000000000002d  0000000000000001  MS       0     0     1
  [27] .debug_aranges    PROGBITS         0000000000000000  00001061
       0000000000000030  0000000000000000           0     0     1
  [28] .debug_info       PROGBITS         0000000000000000  00001091
       000000000000016a  0000000000000000           0     0     1
  [29] .debug_abbrev     PROGBITS         0000000000000000  000011fb
       000000000000007d  0000000000000000           0     0     1
  [30] .debug_line       PROGBITS         0000000000000000  00001278
       0000000000000058  0000000000000000           0     0     1
  [31] .debug_str        PROGBITS         0000000000000000  000012d0
       00000000000000c6  0000000000000001  MS       0     0     1
  [32] .symtab           SYMTAB           0000000000000000  00001398
       0000000000000678  0000000000000018          33    51     8
  [33] .strtab           STRTAB           0000000000000000  00001a10
       00000000000001d3  0000000000000000           0     0     1
  [34] .shstrtab         STRTAB           0000000000000000  00001be3
       0000000000000148  0000000000000000           0     0     1
Key to Flags:
  W (write), A (alloc), X (execute), M (merge), S (strings), I (info),
  L (link order), O (extra OS processing required), G (group), T (TLS),
  C (compressed), x (unknown), o (OS specific), E (exclude),
  l (large), p (processor specific)

There are no section groups in this file.

程序头:
  Type           Offset             VirtAddr           PhysAddr
                 FileSiz            MemSiz              Flags  Align
  PHDR           0x0000000000000040 0x0000000000400040 0x0000000000400040
                 0x00000000000001f8 0x00000000000001f8  R E    8
  INTERP         0x0000000000000238 0x0000000000400238 0x0000000000400238
                 0x000000000000001c 0x000000000000001c  R      1
      [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
  LOAD           0x0000000000000000 0x0000000000400000 0x0000000000400000
                 0x00000000000007a4 0x00000000000007a4  R E    200000
  LOAD           0x0000000000000e10 0x0000000000600e10 0x0000000000600e10
                 0x0000000000000224 0x0000000000000228  RW     200000
  DYNAMIC        0x0000000000000e28 0x0000000000600e28 0x0000000000600e28
                 0x00000000000001d0 0x00000000000001d0  RW     8
  NOTE           0x0000000000000254 0x0000000000400254 0x0000000000400254
                 0x0000000000000044 0x0000000000000044  R      4
  GNU_EH_FRAME   0x0000000000000654 0x0000000000400654 0x0000000000400654
                 0x000000000000003c 0x000000000000003c  R      4
  GNU_STACK      0x0000000000000000 0x0000000000000000 0x0000000000000000
                 0x0000000000000000 0x0000000000000000  RW     10
  GNU_RELRO      0x0000000000000e10 0x0000000000600e10 0x0000000000600e10
                 0x00000000000001f0 0x00000000000001f0  R      1

 Section to Segment mapping:
  段节...
   00
   01     .interp
   02     .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
   03     .init_array .fini_array .jcr .dynamic .got .got.plt .data .bss
   04     .dynamic
   05     .note.ABI-tag .note.gnu.build-id
   06     .eh_frame_hdr
   07
   08     .init_array .fini_array .jcr .dynamic .got

Dynamic section at offset 0xe28 contains 24 entries:
  标记        类型                         名称/值
 0x0000000000000001 (NEEDED)             共享库:[libc.so.6]
 0x000000000000000c (INIT)               0x4003e0
 0x000000000000000d (FINI)               0x400634
 0x0000000000000019 (INIT_ARRAY)         0x600e10
 0x000000000000001b (INIT_ARRAYSZ)       8 (bytes)
 0x000000000000001a (FINI_ARRAY)         0x600e18
 0x000000000000001c (FINI_ARRAYSZ)       8 (bytes)
 0x000000006ffffef5 (GNU_HASH)           0x400298
 0x0000000000000005 (STRTAB)             0x400318
 0x0000000000000006 (SYMTAB)             0x4002b8
 0x000000000000000a (STRSZ)              63 (bytes)
 0x000000000000000b (SYMENT)             24 (bytes)
 0x0000000000000015 (DEBUG)              0x0
 0x0000000000000003 (PLTGOT)             0x601000
 0x0000000000000002 (PLTRELSZ)           72 (bytes)
 0x0000000000000014 (PLTREL)             RELA
 0x0000000000000017 (JMPREL)             0x400398
 0x0000000000000007 (RELA)               0x400380
 0x0000000000000008 (RELASZ)             24 (bytes)
 0x0000000000000009 (RELAENT)            24 (bytes)
 0x000000006ffffffe (VERNEED)            0x400360
 0x000000006fffffff (VERNEEDNUM)         1
 0x000000006ffffff0 (VERSYM)             0x400358
 0x0000000000000000 (NULL)               0x0

重定位节 '.rela.dyn' 位于偏移量 0x380 含有 1 个条目:
  偏移量          信息           类型           符号值        符号名称 + 加数
000000600ff8  000300000006 R_X86_64_GLOB_DAT 0000000000000000 __gmon_start__ + 0

重定位节 '.rela.plt' 位于偏移量 0x398 含有 3 个条目:
  偏移量          信息           类型           符号值        符号名称 + 加数
000000601018  000100000007 R_X86_64_JUMP_SLO 0000000000000000 printf@GLIBC_2.2.5 + 0
000000601020  000200000007 R_X86_64_JUMP_SLO 0000000000000000 __libc_start_main@GLIBC_2.2.5 + 0
000000601028  000300000007 R_X86_64_JUMP_SLO 0000000000000000 __gmon_start__ + 0

The decoding of unwind sections for machine type Advanced Micro Devices X86-64 is not currently supported.

Symbol table '.dynsym' contains 4 entries:
   Num:    Value          Size Type    Bind   Vis      Ndx Name
     0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
     1: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND printf@GLIBC_2.2.5 (2)
     2: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND __libc_start_main@GLIBC_2.2.5 (2)
     3: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND __gmon_start__

Symbol table '.symtab' contains 69 entries:
   Num:    Value          Size Type    Bind   Vis      Ndx Name
     0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
     1: 0000000000400238     0 SECTION LOCAL  DEFAULT    1
     2: 0000000000400254     0 SECTION LOCAL  DEFAULT    2
     3: 0000000000400274     0 SECTION LOCAL  DEFAULT    3
     4: 0000000000400298     0 SECTION LOCAL  DEFAULT    4
     5: 00000000004002b8     0 SECTION LOCAL  DEFAULT    5
     6: 0000000000400318     0 SECTION LOCAL  DEFAULT    6
     7: 0000000000400358     0 SECTION LOCAL  DEFAULT    7
     8: 0000000000400360     0 SECTION LOCAL  DEFAULT    8
     9: 0000000000400380     0 SECTION LOCAL  DEFAULT    9
    10: 0000000000400398     0 SECTION LOCAL  DEFAULT   10
    11: 00000000004003e0     0 SECTION LOCAL  DEFAULT   11
    12: 0000000000400400     0 SECTION LOCAL  DEFAULT   12
    13: 0000000000400440     0 SECTION LOCAL  DEFAULT   13
    14: 0000000000400634     0 SECTION LOCAL  DEFAULT   14
    15: 0000000000400640     0 SECTION LOCAL  DEFAULT   15
    16: 0000000000400654     0 SECTION LOCAL  DEFAULT   16
    17: 0000000000400690     0 SECTION LOCAL  DEFAULT   17
    18: 0000000000600e10     0 SECTION LOCAL  DEFAULT   18
    19: 0000000000600e18     0 SECTION LOCAL  DEFAULT   19
    20: 0000000000600e20     0 SECTION LOCAL  DEFAULT   20
    21: 0000000000600e28     0 SECTION LOCAL  DEFAULT   21
    22: 0000000000600ff8     0 SECTION LOCAL  DEFAULT   22
    23: 0000000000601000     0 SECTION LOCAL  DEFAULT   23
    24: 0000000000601030     0 SECTION LOCAL  DEFAULT   24
    25: 0000000000601034     0 SECTION LOCAL  DEFAULT   25
    26: 0000000000000000     0 SECTION LOCAL  DEFAULT   26
    27: 0000000000000000     0 SECTION LOCAL  DEFAULT   27
    28: 0000000000000000     0 SECTION LOCAL  DEFAULT   28
    29: 0000000000000000     0 SECTION LOCAL  DEFAULT   29
    30: 0000000000000000     0 SECTION LOCAL  DEFAULT   30
    31: 0000000000000000     0 SECTION LOCAL  DEFAULT   31
    32: 0000000000000000     0 FILE    LOCAL  DEFAULT  ABS crtstuff.c
    33: 0000000000600e20     0 OBJECT  LOCAL  DEFAULT   20 __JCR_LIST__
    34: 0000000000400470     0 FUNC    LOCAL  DEFAULT   13 deregister_tm_clones
    35: 00000000004004a0     0 FUNC    LOCAL  DEFAULT   13 register_tm_clones
    36: 00000000004004e0     0 FUNC    LOCAL  DEFAULT   13 __do_global_dtors_aux
    37: 0000000000601034     1 OBJECT  LOCAL  DEFAULT   25 completed.6355
    38: 0000000000600e18     0 OBJECT  LOCAL  DEFAULT   19 __do_global_dtors_aux_fin
    39: 0000000000400500     0 FUNC    LOCAL  DEFAULT   13 frame_dummy
    40: 0000000000600e10     0 OBJECT  LOCAL  DEFAULT   18 __frame_dummy_init_array_
    41: 0000000000000000     0 FILE    LOCAL  DEFAULT  ABS t_assembly.c
    42: 0000000000000000     0 FILE    LOCAL  DEFAULT  ABS crtstuff.c
    43: 00000000004007a0     0 OBJECT  LOCAL  DEFAULT   17 __FRAME_END__
    44: 0000000000600e20     0 OBJECT  LOCAL  DEFAULT   20 __JCR_END__
    45: 0000000000000000     0 FILE    LOCAL  DEFAULT  ABS
    46: 0000000000600e18     0 NOTYPE  LOCAL  DEFAULT   18 __init_array_end
    47: 0000000000600e28     0 OBJECT  LOCAL  DEFAULT   21 _DYNAMIC
    48: 0000000000600e10     0 NOTYPE  LOCAL  DEFAULT   18 __init_array_start
    49: 0000000000400654     0 NOTYPE  LOCAL  DEFAULT   16 __GNU_EH_FRAME_HDR
    50: 0000000000601000     0 OBJECT  LOCAL  DEFAULT   23 _GLOBAL_OFFSET_TABLE_
    51: 0000000000400630     2 FUNC    GLOBAL DEFAULT   13 __libc_csu_fini
    52: 0000000000601030     0 NOTYPE  WEAK   DEFAULT   24 data_start
    53: 0000000000601034     0 NOTYPE  GLOBAL DEFAULT   24 _edata
    54: 0000000000400634     0 FUNC    GLOBAL DEFAULT   14 _fini
    55: 000000000040052d    94 FUNC    GLOBAL DEFAULT   13 f
    56: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND printf@@GLIBC_2.2.5
    57: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND __libc_start_main@@GLIBC_
    58: 0000000000601030     0 NOTYPE  GLOBAL DEFAULT   24 __data_start
    59: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND __gmon_start__
    60: 0000000000400648     0 OBJECT  GLOBAL HIDDEN    15 __dso_handle
    61: 0000000000400640     4 OBJECT  GLOBAL DEFAULT   15 _IO_stdin_used
    62: 00000000004005c0   101 FUNC    GLOBAL DEFAULT   13 __libc_csu_init
    63: 0000000000601038     0 NOTYPE  GLOBAL DEFAULT   25 _end
    64: 0000000000400440     0 FUNC    GLOBAL DEFAULT   13 _start
    65: 0000000000601034     0 NOTYPE  GLOBAL DEFAULT   25 __bss_start
    66: 000000000040058b    41 FUNC    GLOBAL DEFAULT   13 main
    67: 0000000000601038     0 OBJECT  GLOBAL HIDDEN    24 __TMC_END__
    68: 00000000004003e0     0 FUNC    GLOBAL DEFAULT   11 _init

Version symbols section '.gnu.version' contains 4 entries:
 地址:0000000000400358  Offset: 0x000358  Link: 5 (.dynsym)
  000:   0 (*本地*)       2 (GLIBC_2.2.5)   2 (GLIBC_2.2.5)   0 (*本地*)

Version needs section '.gnu.version_r' contains 1 entries:
 地址:0x0000000000400360  Offset: 0x000360  Link: 6 (.dynstr)
  000000: 版本: 1  文件:libc.so.6  计数:1
  0x0010:名称:GLIBC_2.2.5  标志:无  版本:2

Displaying notes found at file offset 0x00000254 with length 0x00000020:
  所有者             Data size  Description
  GNU                  0x00000010       NT_GNU_ABI_TAG (ABI version tag)
    OS: Linux, ABI: 2.6.32

Displaying notes found at file offset 0x00000274 with length 0x00000024:
  所有者             Data size  Description
  GNU                  0x00000014       NT_GNU_BUILD_ID (unique build ID bitstring)
    Build ID: e9861963f99551d49974e36550e73ccc2c63480f
[hdp@cmd perfUcan]$

  

 

f、main的地址都已经匹配到

 

 gdb attach 104168 查堆栈信息  x查内存地址信息

(gdb) backtrace
#0  0x00007f32fee0b9b0 in __write_nocancel () from /lib64/libc.so.6
#1  0x00007f32fed96213 in _IO_new_file_write () from /lib64/libc.so.6
#2  0x00007f32fed97a2e in __GI__IO_do_write () from /lib64/libc.so.6
#3  0x00007f32fed96970 in __GI__IO_file_xsputn () from /lib64/libc.so.6
#4  0x00007f32fed646b7 in vfprintf () from /lib64/libc.so.6
#5  0x00007f32fed6f459 in printf () from /lib64/libc.so.6
#6  0x0000000000400584 in f () at t_assembly.c:13
#7  0x00000000004005b2 in main () at t_assembly.c:23
(gdb) x/3uh 0x400650
0x400650:       26984   0       6913
(gdb) x/3ub 0x400650
0x400650:       104     105     0
(gdb) x/16ub 0x400650
0x400650:       104     105     0       0       1       27      3       59
0x400658:       56      0       0       0       6       0       0       0
(gdb) x/16xb 0x400650
0x400650:       0x68    0x69    0x00    0x00    0x01    0x1b    0x03    0x3b
0x400658:       0x38    0x00    0x00    0x00    0x06    0x00    0x00    0x00

  

 

 

二进制 十进制 十六进制 缩写 Unicode
表示法 脱出字符
表示法 名称/意义
0000 0000 0 00 NUL ␀ ^@ 空字符(Null)
0000 0001 1 01 SOH ␁ ^A 标题开始
0000 0010 2 02 STX ␂ ^B 本文开始
0000 0011 3 03 ETX ␃ ^C 本文结束

001 1011 27 1B ESC ␛ ^[ 退出键


0011 1011 59 3B ;
二进制 十进制 十六进制 图形
0110 0000 96 60 `
0110 0001 97 61 a
0110 0010 98 62 b
0110 0011 99 63 c
0110 0100 100 64 d
0110 0101 101 65 e
0110 0110 102 66 f
0110 0111 103 67 g
0110 1000 104 68 h
0110 1001 105 69 i
0110 1010 106 6A j

 

 

将h i  赋值给edi

 




https://zhuanlan.zhihu.com/p/55896356
函数的第一行涉及rbp和rsp;这些是专用寄存器。
rbp是指向当前栈桢底部的基指针,rsp是指向当前栈桢顶部的堆栈指针。
(译者注:在很多翻译过来的书上,有些地方将Stack翻译为栈桢,有的地方叫堆栈,
只要知道这里的堆栈是指Stack,Heap没关系就好)

rbp = memory address of the base of the prev stack frame
rsp = memory address of the top of the stack

指针寄存器
SP(stack pointer)
BP(base pointer)

堆栈的内存地址越来越低,即向地址小的地方增长。

基指针或帧指针。它指向当前运行的函数的栈桢中的一个固定位置,并为访问函数参数和本地变量提供一个稳定的参考点(基)


{
MOV 指令将源操作数复制到目的操作数。作为数据传送(data transfer)指令,它几乎用在所有程序中。在它的基本格式中,第一个操作数是目的操作数,第二个操作数是源操作数:
MOV destination,source

其中,目的操作数的内容会发生改变,而源操作数不会改变。这种数据从右到左的移动与 C++ 或 Java 中的赋值语句相似:
dest = source;

在几乎所有的汇编语言指令中,左边的操作数是目标操作数,而右边的操作数是源操作数。只要按照如下原则,MOV 指令使用操作数是非常灵活的。
两个操作数必须是同样的大小。
两个操作数不能同时为内存操作数。
指令指针寄存器(IP、EIP 或 RIP)不能作为目标操作数。
}



https://www.oschina.net/translate/the-art-of-picking-intel-registers?lang=chs&p=1
EAX - 累加器寄存器
EBX - 基础寄存器
ECX - 计数器寄存器
EDX - 数据寄存器
ESI - 源指针
EDI - 目的地指针
EBP - 基本指针
ESP - 堆栈指针

EAX - Accumulator Register
EBX - Base Register
ECX - Counter Register
EDX - Data Register
ESI - Source Index
EDI - Destination Index
EBP - Base Pointer
ESP - Stack Pointer

在CPU中,有八个通用寄存器

ax (add,代表相加,累加的意思)累加寄存器

bx (base,代表基地址,存放地址的寄存器) 基址寄存器

cx (count,个数,代表统计的意思)计数寄存器

dx (data,数据) 数据寄存器

SI (source) 源寄存器,存放源地址的内容的寄存器

DI (Dest) 目标寄存器,从源寄存器中memcpy到目标寄存器中

BP (base Point) 堆栈,理解为栈底指针,每次在栈中移动数据,出栈进栈,都会更新.记录的是当前的栈底

SP () 堆栈栈顶指针.

16位汇编第一讲简介
https://www.cnblogs.com/iBinary/p/7446164.html
32位汇编第一讲x86和8086的区别,以及OllyDbg调试器的使用
https://www.cnblogs.com/iBinary/p/7508144.html
一丶32位(x86也称为80386)与8086(16位)汇编的区别
1.寄存器的改变
  AX 变为 EAX 可以这样想,16位通用寄存器前边都加个E开头

例如:

  

EAX EBX ECX EDX ESI EDI ESP EBP ;八个寄存器
EIP EFLAGES ;特殊寄存器
CS ES SS DS GS FS            ;其中GS FS是新增加的寄存器,这些段寄存器,并不是4个字节(32位的)还是以前16位的
注意在32位下没有分段的概念的,因为寻址能力是 0- FFFFFFFF ,在当时的inter认为当初的4G已经很厉害了,那是后最好的内存才1G,放到现在看

我们感觉4G不够用了,但也是近几年才开始用的8G

有分区的概念,比如我们16位汇编中,给代码分段的时候,顺便分了一下区,分区是为了更好的管理代码的编写


https://sourceware.org/gdb/current/onlinedocs/gdb/Memory.html
u10进制 x16
(gdb) x/16ub 0x400650
0x400650: 104 105 0 0 1 27 3 59
0x400658: 56 0 0 0 6 0 0 0
(gdb) x/16xb 0x400650
0x400650: 0x68 0x69 0x00 0x00 0x01 0x1b 0x03 0x3b
0x400658: 0x38 0x00 0x00 0x00 0x06 0x00 0x00 0x00

 

环境信息

[hdp@cmd ~]$ cat  /proc/version
Linux version 3.10.0-1062.4.1.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-39) (GCC) ) #1 SMP Fri Oct 18 17:15:30 UTC 2019
[hdp@cmd ~]$ cat /proc/cpuinfo
processor       : 0
vendor_id       : GenuineIntel
cpu family      : 6
model           : 79
model name      : Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz
stepping        : 1
microcode       : 0xffffffff
cpu MHz         : 2095.146
cache size      : 20480 KB
physical id     : 0
siblings        : 2
core id         : 0
cpu cores       : 1
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 20
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology eagerfpu pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 movbe popcnt aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch invpcid_single ibrs ibpb stibp fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx smap xsaveopt spec_ctrl intel_stibp arch_capabilities
bogomips        : 4190.29
clflush size    : 64
cache_alignment : 64
address sizes   : 44 bits physical, 48 bits virtual
power management:

processor       : 1
vendor_id       : GenuineIntel
cpu family      : 6
model           : 79
model name      : Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz
stepping        : 1
microcode       : 0xffffffff
cpu MHz         : 2095.146
cache size      : 20480 KB
physical id     : 0
siblings        : 2
core id         : 0
cpu cores       : 1
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 20
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology eagerfpu pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 movbe popcnt aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch invpcid_single ibrs ibpb stibp fsgsbase bmi1 hle avx2 smep bmi2 erms invpcid rtm rdseed adx smap xsaveopt spec_ctrl intel_stibp arch_capabilities
bogomips        : 4190.29
clflush size    : 64
cache_alignment : 64
address sizes   : 44 bits physical, 48 bits virtual
power management:

[hdp@cmd ~]$

  

 

posted @ 2018-10-21 19:48  papering  阅读(1137)  评论(0编辑  收藏  举报