va_list、va_start、va_arg、va_end的原理与使用

  1. 概述
    由于在C语言中没有函数重载,解决不定数目函数参数问题变得比较麻烦;即使采用C++,如果参数个数不能确定,也很难采用函数重载.对这种情况,有些人采用指针参数来解决问题.下面就c语言中处理不定参数数目的问题进行讨论.
  2. 定义
    大家先看几宏.
    在VC++6.0的include有一个stdarg.h头文件,有如下几个宏定义:
    #define _INTSIZEOF(n)   ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) 
    #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )           //第一个可选参数地址
    #define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) //下一个参数地址
    #define va_end(ap)    ( ap = (va_list)0 )                            // 将指针置为无效
    如果对以上几个宏定义不理解,可以略过,接这看后面的内容.
  3. 参数在堆栈中分布,位置
    在进程中,堆栈地址是从高到低分配的.当执行一个函数的时候,将参数列表入栈,压入堆栈的高地址部分,然后入栈函数的返回地址,接着入栈函数的执行代码,这个入栈过程,堆栈地址不断递减,一些黑客就是在堆栈中修改函数返回地址,执行自己的代码来达到执行自己插入的代码段的目的.
    总之,函数在堆栈中的分布情况是:地址从高到低,依次是:函数参数列表,函数返回地址,函数执行代码段.
    堆栈中,各个函数的分布情况是倒序的.即最后一个参数在列表中地址最高部分,第一个参数在列表地址的最低部分.参数在堆栈中的分布情况如下:
    最后一个参数
    倒数第二个参数
    ...
    第一个参数
    函数返回地址
    函数代码段
  4. 示例代码
    void arg_test(int i, ...);
    int main(int argc,char *argv[]) 
    {
       int int_size = _INTSIZEOF(int);
       printf("int_size=%d\n", int_size);
       arg_test(0, 4);
     
       arg_cnt(4,1,2,3,4);
       return 0;
    }
    void arg_test(int i, ...)
    {
       int j=0; 
       va_list arg_ptr; 
     
       va_start(arg_ptr, i); 
       printf("&i = %p\n", &i);//打印参数i在堆栈中的地址
       printf("arg_ptr = %p\n", arg_ptr);
       //打印va_start之后arg_ptr地址,
       //应该比参数i的地址高sizeof(int)个字节
       //这时arg_ptr指向下一个参数的地址
     
       j=*((int *)arg_ptr);
       printf("%d %d\n", i, j); 
       j=va_arg(arg_ptr, int); 
       printf("arg_ptr = %p\n", arg_ptr);
       //打印va_arg后arg_ptr的地址
       //应该比调用va_arg前高sizeof(int)个字节
       //这时arg_ptr指向下一个参数的地址
       va_end(arg_ptr); 
       printf("%d %d\n", i, j); 
    }

  5. 代码说明:
    int int_size = _INTSIZEOF(int);得到int类型所占字节数
     va_start(arg_ptr, i); 得到第一个可变参数地址,

    根据定义(va_list)&v得到起始参数的地址, 再加上_INTSIZEOF(v) ,就是其实参数下一个参数的地址,即第一个可变参数地址.
    j=va_arg(arg_ptr, int); 得到第一个参参数的值,并且arg_ptr指针上移一个_INTSIZEOF(int),即指向下一个可变参数的地址.
    va_end(arg_ptr);置空arg_ptr,即arg_ptr=0;
    总结:读取可变参数的过程其实就是堆栈中,使用指针,遍历堆栈段中的参数列表,从低地址到高地址一个一个地把参数内容读出来的过程.

  6. 在编程中应该注意的问题和解决办法
    虽然可以通过在堆栈中遍历参数列表来读出所有的可变参数,但是由于不知道可变参数有多少个,什么时候应该结束遍历,如果在堆栈中遍历太多,那么很可能读取一些无效的数据.
    解决办法:a.可以在第一个起始参数中指定参数个数,那么就可以在循环还中读取所有的可变参数;b.定义一个结束标记,在调用函数的时候,在最后一个参数中传递这个标记,这样在遍历可变参数的时候,可以根据这个标记结束可变参数的遍历;
    下面是一段示例代码:
    //第一个参数定义可选参数个数,用于循环取初参数内容
    void arg_cnt(int cnt, ...);
    int main(int argc,char *argv[]) 
    {
       int int_size = _INTSIZEOF(int);
       printf("int_size=%d\n", int_size);
       arg_cnt(4,1,2,3,4);
       return 0;
    }
    void arg_cnt(int cnt, ...)
    {
       int value=0; 
       int i=0;
       int arg_cnt=cnt; 
       va_list arg_ptr; 
       va_start(arg_ptr, cnt); 
       for(i = 0; i < cnt; i++)
       {
          value = va_arg(arg_ptr,int);
          printf("value%d=%d\n", i+1, value);
       }
    }

    虽然可以根据上面两个办法解决读取参数个数的问题,但是如果参数类型都是不定的,该怎么办,如果不知道参数的类型,即使读到了参数也没有办法进行处理.解决办法:可以自定义一些可能出现的参数类型,这样在可变参数列表中,可以可变参数列表中的那类型,然后根据类型,读取可变参数值,并进行准确地转换.传递参数的时候可以这样传递:参数数目,可变参数类型1,可变参数值1,可变参数类型2,可变参数值2,....
    这里给出一个完整的例子:
    #include <stdio.h>
    #include <stdarg.h>
    const int INT_TYPE  = 100000;
    const int STR_TYPE  = 100001;
    const int CHAR_TYPE  = 100002;
    const int LONG_TYPE  = 100003;
    const int FLOAT_TYPE = 100004;
    const int DOUBLE_TYPE = 100005;
    //第一个参数定义可选参数个数,用于循环取初参数内容
    //可变参数采用arg_type,arg_value...的形式传递,以处理不同的可变参数类型
    void arg_type(int cnt, ...);
    //第一个参数定义可选参数个数,用于循环取初参数内容
    void arg_cnt(int cnt, ...);
    //测试va_start,va_arg的使用方法,函数参数在堆栈中的地址分布情况
    void arg_test(int i, ...);
    int main(int argc,char *argv[]) 
    {
       int int_size = _INTSIZEOF(int);
       printf("int_size=%d\n", int_size);
       arg_test(0, 4);
     
       arg_cnt(4,1,2,3,4);
       arg_type(2, INT_TYPE, 222, STR_TYPE, "ok,hello world!");
       return 0;
    }

    void arg_test(int i, ...)
    {
       int j=0; 
       va_list arg_ptr; 
 
       va_start(arg_ptr, i); 
       printf("&i = %p\n", &i);//打印参数i在堆栈中的地址
       printf("arg_ptr = %p\n", arg_ptr);
       //打印va_start之后arg_ptr地址,
       //应该比参数i的地址高sizeof(int)个字节
       //这时arg_ptr指向下一个参数的地址
 
       j=*((int *)arg_ptr);
       printf("%d %d\n", i, j); 
       j=va_arg(arg_ptr, int); 
       printf("arg_ptr = %p\n", arg_ptr);
       //打印va_arg后arg_ptr的地址
       //应该比调用va_arg前高sizeof(int)个字节
       //这时arg_ptr指向下一个参数的地址
       va_end(arg_ptr); 
       printf("%d %d\n", i, j); 
    }
    void arg_cnt(int cnt, ...)
    {
       int value=0; 
       int i=0;
       int arg_cnt=cnt; 
       va_list arg_ptr; 
       va_start(arg_ptr, cnt); 
       for(i = 0; i < cnt; i++)
       {
          value = va_arg(arg_ptr,int);
          printf("value%d=%d\n", i+1, value);
       }
    }
    void arg_type(int cnt, ...)
    {
       int arg_type = 0;
       int int_value=0; 
       int i=0;
       int arg_cnt=cnt; 
       char *str_value = NULL;
       va_list arg_ptr; 
       va_start(arg_ptr, cnt); 
       for(i = 0; i < cnt; i++)
       {
          arg_type = va_arg(arg_ptr,int);
          switch(arg_type)
          {
            case INT_TYPE:
               int_value = va_arg(arg_ptr,int);
               printf("value%d=%d\n", i+1, int_value);
               break;
            case STR_TYPE:
               str_value = va_arg(arg_ptr,char*);
               printf("value%d=%s\n", i+1, str_value);
               break;
            default:
               break;
          }
       }

    }  

posted @ 2012-09-23 13:18  beanmoon  阅读(223)  评论(0编辑  收藏  举报