x86 x64下调用约定浅析

 

x86平台下调用约定  

  我们都知道x86平台下常用的有三种调用约定,__cdecl、__stdcall、__fastcall。我们分别对这三种调用约定进行分析。

  __cdecl

  __cdecl是C/C++的默认调用约定,如果不显示声明调用约定的情况下,就是该调用约定。下面我们来从汇编层次来熟悉这种调用约定。

我写了一个函数,如下:

1 int __cdecl TestCdecl(int a, int b, int c, int d, int e)
2 {
3     return a + b + c + d + e;
4 }

  对了,给大家说一下,VS如何进入反汇编。我们在调试界面下,按住Alt+8键就可以进入反汇编窗口了。

  可以看出__cdecl参数从右至左入栈,然后由调用者(caller)清理栈区。

  __stdcall

  __stdcall是Windows API默认调用约定,微软的WINAPI、CALLBACK等宏都是这个调用约定,我还是写了个例子来看一下。

1 int __stdcall TestStdcall(int a, int b, int c, int d, int e)
2 {
3     return a + b + c + d + e;
4 }

  我们继续来看一下反汇编。

  可以看到,main函数并没有对子函数的清栈过程,__stdcall参数跟__cdecl入栈方式相同,从右至左入栈,被调用者(callee)清理栈区。

  __fastcall

  __fastcall是32位下一种特殊的调用约定,我慢还是通过代码和反汇编看看它到底特殊在哪。

1 int __fastcall TestFastcall(int a, int b, int c, int d, int e)
2 {
3     return a + b + c + d + e;
4 }

  我们可以看到,__fastcall参数还是从右至左入栈,但是不同的是前两个参数被分别放进了ecx、edx寄存器,如果少于或等于两个参数,会先将参数放入寄存器。同样由被调用者(callee)清理栈区。

 x64平台下调用约定

  我们再来看一下64位情况下调用约定。同样我们测试声明为__cdecl的调用约定。反汇编结果如下:

  我们看到这个入栈方式怎么跟32位下fastcall的入栈很像。这时候查一下CSDNhttps://www.microsoft.com/china/MSDN/library/Windev/64bit/issuesx64.mspx?pf=true

发现有如下一句话:在设计调用约定时,x64 体系结构利用机会清除了现有 Win32 调用约定(如 __stdcall、__cdecl、__fastcall、_thiscall 等)的混乱。在 Win64 中,只有一个本机调用约定和 __cdecl 之类的修饰符被编译器忽略。除此之外,减少调用约定行为还为可调试性带来了好处。

  原来64位平台下只有一种变形的__fastcall的调用约定,前4参数则先放入ecx、edx、r8、r9寄存器,更多的参数放入栈区。这个时候我们要注意的是,在64位下,系统还是为前4个参数预留了栈区空间(每个栈空间大小为8字节,共32字节大小),然后将基存器的值放入所预留的栈区空间。为什么系统要多此一举呢?我们都知道寄存器传递参数速度要远大于栈区传值,而将寄存器中的值再放入栈区预留空间,这是为了防止在传递参数的过程中,寄存器需要接收其他的值而导致参数无法传递,或者其他值无法接收的情况。

  另外我们还看到CSDN上说64位下__fastcall由调用者(caller)清理栈区空间。但是我们为什么没有看见main()函数清理子函数栈空间的过程呢?

  这是由于64位平台下栈区空间开辟问题导致。我们还在CSDN上看到这样一句话:与通过 PUSH 和 POP 指令在堆栈中显式添加和移除参数的 x86 编译器不同,x64 代码生成器会预留足够的堆栈空间,以调用最大目标函数(参数方法)所使用的任何内容。随后,在调用子函数时,它重复使用相同的堆栈区域来设置参数。

  这句话什么意思呢?它的意思就是我们在64位下一开始系统会为main()函数开辟一个很大的栈区,但是main()函数并未消耗掉这么大的栈区空间,这时候怎么办呢?子函数就会还继续利用main()函数的栈区空间,所以main()函数并不用对子函数栈区空间进行清理。

参数列表

  这时候我们再来看一下一些特殊的问题,在C/C++下有一个可变长参数列表的概念。我们来看一下在这种情况下,调用约定又有什么变化。

x86下参数列表

  按照惯例先看代码

 1 int __fastcall Test(unsigned int n, ...)
 2 {
 3     int sum = 0;
 4     va_list args;
 5     va_start(args, n);
 6     while (n>0)
 7     {
 8         //通过va_arg(args,int)依次获取参数的值  
 9         sum += va_arg(args, int);
10         n--;
11     }
12     va_end(args);
13     return sum;
14 }

  再来看看反汇编:

  我们可以看到,这时候__fastcall已经退化为__cdecl了,其实其他调用约定也一样,在32位平台下全部会退化为__cdecl。

x64平台下调用约定

  我们再将函数编译为64位,反编译如下:

  这个还是64位下默认的特殊的__fastcall调用约定。至此调用约定相关问题已基本说完了,小弟不才,有什么不对的地方还请指正。

posted @ 2017-03-31 10:38  Toring  阅读(3848)  评论(0编辑  收藏  举报