转:从寄存器看I386和x64位中函数调用中参数传递
原文:http://hi.baidu.com/unix21/item/8cf4d132e4355daeb711db5e
从寄存器看I386和x64位中函数调用中参数传递
x86_64基本使用寄存器存储函数参数,寄存器不够才入栈;
而i386将所有参数保存在栈上,通过gcc的扩展功能__attribute__((regparm()))即可实现部分参数的寄存器传递。
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
#include <stdio.h> #include <stdlib.h> int v1 = 1; float v2 = 0.01; #ifdef FAST __attribute__((regparm(3))) #endif void func( int a, long b, short c, char d, long long e, float f, double g, int *h, float *i, char *j) { printf ( "a: %d, b: %ld, c: %d, d: %c, e: %lld\n" "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n" , a, b, c, d, e, f, g, h, i, j); } int main( void ) { func(100, 35000L, 5, 'A' , 123456789LL, 3.14, 2.99792458e8, &v1, &v2, "string" ); return EXIT_SUCCESS; } |
编译
gcc -g -Wall -o test test.c
启动gdb
(gdb) b * func
说明:break中不加* 使用函数名就无法用于参数确认
不加*,断点就不会设置到汇编语言层级的函数开头
(gdb) r
(gdb) p *(int*)($esp)
在i386上原则上参数全部入栈,取得第一个参数使用esp+4,因为i386架构中栈的开头即esp+0,保存返回地址。
下一个参数f的存储地址要比上一个参数大8个字节,因为i386架构中long long型和double型是8字节
i386寄存器调用
fastcall快速调用:i386像x86_64一样将部分参数放寄存器中。
__attribute__((regparm(3)))使用eax,edx和ecx传递开头3个参数。
修改代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
#include <stdio.h> #include <stdlib.h> #define FAST 1 int v1 = 1; float v2 = 0.01; #ifdef FAST __attribute__((regparm(3))) #endif void func( int a, long b, short c, char d, long long e, float f, double g, int *h, float *i, char *j) { printf ( "a: %d, b: %ld, c: %d, d: %c, e: %lld\n" "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n" , a, b, c, d, e, f, g, h, i, j); } int main( void ) { func(100, 35000L, 5, 'A' , 123456789LL, 3.14, 2.99792458e8, &v1, &v2, "string" ); return EXIT_SUCCESS; } |
第1,2,3个参数a ,b,c放在eax,edx,ecx中。
如果第1个参数为long long类型(64位),那么就会组合使用eax ,edx 等寄存器来传参。
如果第2个参数为long long类型(64位),那么就只有在第一个参数为32位才能寄存器传递。
regparm
GCC中可以使用__attribute__((regparm(n)))指定最多可以使用n个寄存器(eax, edx, ecx)传递参数,n的范围是0~3,超过n时则将参数压入栈中(n=0表示不用寄存器传递参数)。
看下面例子,函数p1约定不使用寄存器传递参数,尽管只有1个参数,仍然将参数压入栈中。
函数p2约定最多可使用3个寄存器传递参数,因为输入参数有4个,所以前三个使用寄存器传递,最后一个压入栈中。
int q = 5;
int t1 = 1;
int t2 = 2;
int t3 = 3;
int t4 = 4;
#define REGPARM3 __attribute((regparm(3)))
#define REGPARM0 __attribute((regparm(0)))
void REGPARM0 p1(int a)
{
q = a + 1;
}
void REGPARM3 p2(int a, int b, int c, int d)
{
q = a + b + c + d + 1;
}
同样的代码我们看64位下的效果