从反汇编的角度看引用和指针的区别
上午和同学一起讨论指针和引用的区别,其实大家都知道是怎么的。只是一直以来都没有证据,一直都没有深入下去,看看下层的汇编究竟是怎么回事?写了如下的代码,用VS2008生成可执行程序,然后用ollyDbg进行调试;
#include <iostream>
using namespace std;
int main()
{
int x = 0;
int *px = &x;
int &rx = x;
printf("&x=%p\t&px=%p\t&rx=%p\n ",&x,&px,&rx);
return 0;
}
我们想要得出的结论是:引用是不会重新分配存储空间,它和被引用的变量共享一个存储空间;而指针会重新分配存储空间,指针的内容是存放的它指向变量的地址。
使用OllyDbg,打开用VS2008编译生成的POJ.exe:
一步一步的执行,直到call main,如下图所示:
点击step into(f7),进入到main函数,我们看到main函数内的代码,如下图所示:
现在我们对上面的代码进行详细的分析;
先分析第1~4条指令,一进入main函数,第一步将ESP的值减去8;第二步将ESP的值存放到EAX当中,第三步将EAX的值存放到ECX当中,
第四步将ECX压栈;
这四条指令执行过后,各个寄存器和堆栈的内容如下图所示:
寄存器的值:
我们可以看到ESP=0012FF74,ESP指向内存的地方存入了值0012FF78,这个值就是第2、3条指令执行过后,EAX和ECX中的值。这个值其实就是C++代码中变量x的地址。
第2条指令是取得当前ESP的值,把它的值作为了变量x的地址,然后将这个值存放在ECX当中,因为后面还有rx,rx是x的引用,而引用只不过是变量x的别名,不会
另外分配地址的。总结起来,前四条指令就是从堆栈中分配一个地址给变量x和引用rx,这也印证了C语言中,局部变量的空间是在堆栈中分配的原则,而变量的空间其实就是一个
地址范围,第4条指令的压栈操作就是对应于printf的最右边的操作数:&rx,可以看到的值和x地址的值是相等的。
现在分析第5~6条指令,第5条指令取得ESP+8的值,并且将这个值存放到EDX当中,第6条指令将EDX的值压栈。其实这3条指令就是给指针变量px分配存储空间,并且
将作为printf的参数压入到堆栈当中。
现在分析第7条指令,它直接将EAX的值压栈,而EAX中的值存放的就是x的地址,这里对应的是printf函数,从右向左数的第三个参数,也就是&x,它的
值和ECX的值是相等的,也就是和&rx的值是相等的。
根据上面的分析,我们可以得到如下的堆栈图:
第八条指令是将printf的第一个格式字符串的地址压入到堆栈中,作为参数传递到printf函数。
第9,10条指令,其实就是分别对变量x和指针变量px赋值。如上图所示,esp’+0x10就是指向变量x和引用rx,exp’+0x14就是指向指针变量px.
在这里总结一下有如下几点:
1.C/C++语言中的局部变量是在堆栈上分配的,在汇编当中,局部变量的空间就是esp的某个值对应的内存中的地址;
2.C++中,引用和指针是不一样的,在汇编层面表现出来的区别就是:引用和被引用的变量是使用的同一个地址,而指针变量是另外分配的空间,
也就是对应另外一个esp的值;
3.反汇编的结果表明,汇编是先批量分配完C语言中变量的空间,然后再批量对变量进行赋值;