懂了GNUC属性,C大牛非你莫属

之前,小编黑鸟连续日更了十篇GNU C中特有的不同于ANSI C标准的语法扩展,这些扩展往往是普通教材中不会提及的。而恰恰是这些%1的语法影响着我们%99的人能否在众多C程序员中脱颖而出,成为同事眼中的大牛和boss眼中的红人。

大家有没有这种经历,在自认为自己C语言水平已经达到某种境界的时候,兴致冲冲的拿起一本linux内核解析之类的书,准备下大决心啃完里面的系统程序,看看业界大牛是怎么编写C语言程序的时候,往往在惊叹作者奇思妙想,做到人C合一的时候,发现里面遍布了许多陌生的关键字或语法,而这些恰恰是精髓所在,只可惜我们学艺不精,无法领略。

那么,今天我将陆续推出系列GNU C中特有的语法扩展详解,为你在C语言进阶路上保驾护航!

一、linux gcc的属性解析

  • GNU C的一大特色(却不被初学者所知)就是__attribute__机制。__attribute__可以设置函数属性(Function Attribute)、变量属性(Variable Attribute)和类型属性(Type Attribute)。

  • __attribute__书写特征是:__attribute__前后都有两个下划线,并切后面会紧跟一对原括弧,括弧里面是相应的__attribute__参数。

  • __attribute__语法格式为:
    __attribute__((attribute-list))
    其位置约束为:放于声明的尾部“;”之前。

1 函数属性(FunctionAttribute)

函数属性可以帮助开发者把一些特性添加到函数声明中,从而可以使编译器在错误检查方面的功能更强大。__attribute__机制也很容易同非GNU应用程序做到兼容之功效。
GNU C需要使用–Wall编译器来击活该功能,这是控制警告信息的一个很好的方式。下面介绍几个
常见的属性参数。

1 __attribute__format

  • __attribute__属性可以给被声明的函数加上类似printf或者scanf的特征,它可以使编译器检查函数声明和函数实际调用参数之间的格式化字符串是否匹配。该功能十分有用,尤其是处理一些很难发现的bug。
  • format的语法格式为:
    format(archetype,string-index,first-to-check)
  • format属性告诉编译器,按照printf, scanf, strftime或strfmon的参数表格式规则对该函数的参数进行检查。

“archetype”指定是哪种风格;
“string-index”指定传入函数的第几个参数是格式化字符串;
“first-to-check”指定从函数的第几个参数开始按上述规则进行检查。

具体使用格式如下:
__attribute__((format(printf,m,n)))
__attribute__((format(scanf,m,n)))
其中参数m与n的含义为:

m:第几个参数为格式化字符(formatstring);
n:参数集合中的第一个(即参数“…”里的第一个参数)在函数参数总数排在第几,注意,有时函数参数里还有“隐身”的呢,后面会提到;

  • 一般__attribute__((format(printf,m,n)))是常用的,而另一种却很少见到。下面举例说明,
//m=1;n=2
extern void myprint(const char* format,...)__attribute__((format(printf,1,2)));
//m=2;n=3
extern void myprint(int l, const char* format, ...)__attribute__((format(printf,2,3)));

需要特别注意的是,如果myprint是一个函数的成员函数,那么m和n的值可有点“悬乎”了,例如:

//m=3;n=4
extern void myprint(int l, const char* format, ...)__attribute__((format(printf,3,4)));

其原因是,类成员函数的第一个参数实际上是一个“隐身”的“this”指针。(有点C++基础的都知道点
this指针,不知道你在这里还知道吗?)

这里给出测试用例:attribute.c,代码如下:

extern void myprint(const char* format, ...)__attribute__((format(printf,1,2)));
void test()
{
    myprint("i=%d\n",6);
    myprint("i=%s\n",6);
    myprint("i=%s\n","abc");
    myprint("%s,%d,%d\n",1,2);
}

运行$gcc –Wall –c attribute.cattribute后,输出结果为:

attribute.c: In function`test':
attribute.c:7:warning:format argument is not a pointer(arg2)
attribute.c:9:warning:format argument is not a pointer(arg2)
attribute.c:9:warning:too few arguments for format

如果在attribute.c中的函数声明去掉__attribute__((format(printf,1,2))),再重新编译,即运行
$gcc –Wall –c attribute.c attribute后,则并不会输出任何警告信息。

注意,默认情况下,编译器是能识别类似printf的“标准”库函数。

2 __attribute__noreturn

  • 该属性通知编译器函数从不返回值,当遇到类似函数需要返回值而却不可能运行到返回值处就已经退出来的情况,该属性可以避免出现错误信息。
  • C库函数中的abort()和exit()的声明格式就采用了这种格式,如下所示:
extern void exit(int)__attribute__((noreturn));
extern void abort(void)__attribute__((noreturn));

为了方便理解,大家可以参考如下的例子:

extern void myexit();
int test(int n)
{
    if(n>0){
        myexit(); /*程序不可能到达这里*/
    }
    else{
        ...
    }
    return0;
}

编译显示的输出信息为:

$gcc –Wall –c noreturn.c
noreturn.c:In function `test':
noreturn.c:12:warning:control reaches end of non-void function

警告信息也很好理解,因为你定义了一个有返回值的函数test却有可能没有返回值,程序当然不知道怎么办了!加上__attribute__((noreturn))则可以很好的处理类似这种问题。把extern void myexit()修改为:extern void myexit()__attribute__((noreturn))之后,编译不会再出现警告信息。

3 __attribute__const

  • 该属性只能用于带有数值类型参数的函数上。当重复调用带有数值参数的函数时,由于返回值是相同的,所以此时编译器可以进行优化处理,除第一次需要运算外,其它只需要返回第一次的结果就可以了,进而可以提高效率。
  • 该属性主要适用于没有静态状态(static state)和副作用的一些函数,并且返回值仅仅依赖输入的参数。
  • 为了说明问题,下面举个非常“糟糕”的例子,该例子将重复调用一个带有相同参数值的函数,具体如下:
extern int square(int n)__attribute__((const));
...
for(i=0;i<100;i++)
{
    total+=square(5)+i;
}

通过添加__attribute__((const))声明,编译器只调用了函数一次,以后只是直接得到了相同的一个返回值。

事实上,const参数不能用在带有指针类型参数的函数中,因为该属性不但影响函数的参数值,同样也影响到了参数指向的数据,它可能会对代码本身产生严重甚至是不可恢复的严重后果。

并且,带有该属性的函数不能有任何副作用或者是访问全局或静态变量,所以,类似getchar()或
time()的函数是不适合使用该属性的。

4 同时使用多个属性

  • 可以在同一个函数声明里使用多个__attribute__,并且实际应用中这种情况是十分常见的。使用方式上,你可以选择两个单独的__attribute__,或者把它们写在一起,可以参考下面的例子:
/*把类似printf的消息传递给stderr并退出 */
extern void die(const char* format,...)__attribute__((noreturn))__attribute__((format(printf,1,2)));

或者写成

extern void die(const char* format,...)__attribute__((noreturn,format(printf,1,2)));
  • 如果带有该属性的自定义函数追加到库的头文件里,那么所有调用该函数的程序都要做相应的检
    查。

5 和非GNU编译器的兼容性

  • 庆幸的是,__attribute__设计的非常巧妙,很容易做到和其它编译器保持兼容,也就是说,如果工作在其它的非GNU编译器上,可以很容易的忽略该属性。即使attribute使用了多个参数,也可以很容易的使用一对圆括弧进行处理,例如:
/*如果使用的是非GNU C,那么就忽略__attribute__*/
#ifndef __GNUC__
#define __attribute__(x) /*NOTHING*/
#endif
  • 需要说明的是,__attribute__适用于函数的声明而不是函数的定义。所以,当需要使用该属性的函数时,必须在同一个文件里进行声明,例如:
/*函数声明 */
void die(const char* format,...)__attribute__((noreturn))__attribute__((format(printf,1,2)));
void die(const char* format,...)
{
    /*函数定义 */
}

2 变量属性(VariableAttributes)

  • 关键字__attribute__也可以对变量(variable)或结构体成员(structurefield)进行属性设置。这里给出几个常用的参数的解释,更多的参数可参考本文给出的连接。

  • 在使用__attribute__参数时,你也可以在参数的前后都加上__(两个下划线),例如,使用__aligned__而不是aligned,这样,你就可以在相应的头文件里使用它而不用关心头文件里是否有重名的宏定义。

1 aligned(alignment)

  • 该属性规定变量或结构体成员的最小的对齐格式,以字节为单位。例如在下面的声明中,编译器将以16字节(注意是字节byte不是位bit)对齐的方式分配一个变量。:
int x__attribute__((aligned(16)))=0;
  • 也可以对结构体成员变量设置该属性,例如,创建一个双字对齐的int对,可以这么写:
struct foo{
    int x[2]__attribute__((aligned(8)));
};
  • 同样,你也可以使用默认的对齐方式。如果aligned后面不紧跟一个指定的数字值,那么编译器将依据你的目标机器情况使用最大最有益的对齐方式。例如:
short array[3]__attribute__((aligned));
  • 选择针对目标机器最大的对齐方式,可以提高拷贝操作的效率。aligned属性使被设置的对象占用更多的空间,相反的,使用packed可以减小对象占用的空间。
  • 需要注意的是,attribute属性的效力与你的连接器也有关,如果你的连接器最大只支持16字节对齐,那么你此时定义32字节对齐也是无济于事的。

2 packed

  • 使用该属性可以使得变量或者结构体成员使用最小的对齐方式,即对变量是一字节对齐,对域(field)是位对齐。
  • 下面的例子中,x成员变量使用了该属性,则其值将紧放置在a的后面:
struct test
{
    char a;
    int x[2]__attribute__((packed));
};

其它可选的属性值还可以是:cleanup,common,nocommon,deprecated,mode,section,shared,tls_model,transparent_union,unused,vector_size,weak,dllimport等。
详细信息可参考:
GNUC变量属性

3 类型属性(Type Attribute)

  • 关键字__attribute__也可以对结构体(struct)或共用体(union)进行属性设置。大致有六个参数值可以被设定,即:aligned, packed, transparent_union, unused, deprecated和 may_alias。

aligned

  • 在使用__attribute__参数时,你也可以在参数的前后都加上__(两个下划线),例如,使用__aligned__而不是aligned,这样,你就可以在相应的头文件里使用它而不用关心头文件里是否有aligned(alignment)。

  • 该属性设定一个指定大小的对齐格式(以字节为单位),例如:

struct S{shortf[3]; }__attribute__((aligned(8)));
typedef int more_aligned_int__attribute__((aligned(8)));

该声明将强制编译器确保(尽它所能)变量类型为struct S或者more-aligned-int的变量在分配空
间时采用8字节对齐方式。

  • 如上所述,你可以手动指定对齐的格式,同样,你也可以使用默认的对齐方式。如果aligned后面不紧跟一个指定的数字值,那么编译器将依据你的目标机器情况使用最大最有益的对齐方式。例如:
struct S{shortf[3];}__attribute__((aligned));

这里,如果sizeof(short)的大小为2(byte),那么,S的大小就为6。取一个2的次方值,使得该值
大于等于6,则该值为8,所以编译器将设置S类型的对齐方式为8字节。

  • aligned属性使被设置的对象占用更多的空间,相反的,使用packed可以减小对象占用的空间。
    需要注意的是,attribute属性的效力与你的连接器也有关,如果你的连接器最大只支持16字节对齐,那么你此时定义32字节对齐也是无济于事的。

packed

  • 使用该属性对struct或者union类型进行定义,设定其类型的每一个变量的内存约束。当用在enum类型定义时,暗示了应该使用最小完整的类型(it indicates that the smallest integral type should be used)。
  • 下面的例子中,my-packed-struct类型的变量数组中的值将会紧紧的靠在一起,但内部的成员变量s不会被“pack”,如果希望内部的成员变量也被packed的话,my-unpacked-struct也需要使用packed进行相应的约束。
struct my_unpacked_struct
{
    char c;
    int i;
};
struct my_packed_struct
{
    char c;
    int i;
    struct my_unpacked_struct s;
}__attribute__((__packed__));

变量属性与类型属性举例

下面的例子中使用__attribute__属性定义了一些结构体及其变量,并给出了输出结果和对结果的分析。程序代码为:

struct p
{
    int a;
    char b;
    char c;
}__attribute__((aligned(4))) pp;

struct q
{
    int a;
    char b;
    struct p qn;
    char c;
}__attribute__((aligned(8))) qq;

int main()
{
 printf("sizeof(int)=%d,sizeof(short)=%d,sizeof(char)=%d\n",\
        sizeof(int),sizeof(short),sizeof(char));
printf("pp=%d,qq=%d\n",sizeof(pp),sizeof(qq));
return0;
}

输出结果:

sizeof(int)=4,sizeof(short)=2.sizeof(char)=1
pp=8,qq=24

分析:

sizeof(pp):sizeof(a)+sizeof(b)+sizeof(c)=4+1+1=6<23=8=sizeof(pp)
sizeof(qq):sizeof(a)+sizeof(b)=4+1=5

sizeof(qn)=8;即qn是采用8字节对齐的,所以要在a,b后面添3个空余字节,然后才能存储qn,
4+1+(3)+8+1=17因为qq采用的对齐是8字节对齐,所以qq的大小必定是8的整数倍,即qq的大小
是一个比17大又是8的倍数的一个最小值,由此得到17<24+8=24=sizeof(qq)

posted @ 2023-01-30 10:18  阿风小子  阅读(86)  评论(0编辑  收藏  举报