GCC 中零长数组与变长数组

前两天看程序，发现在某个函数中有下面这段程序：

int n;              //define a variable n
int array[n];       //define an array with length n

在我所学的C语言知识中，这种数组的定义在编译时就应该有问题的，因为定义数组时，数组的长度必须要是一个大于0的整型字面值或定义为 const 的常量。例如下面这样

int array1[10];     //valid
int const N = 10;
int array2[N];      //valid
int n = 10;
int array3[n];      //invalid

但从上面看第三种定义数组的方法也是正确的，于是，我用 gcc 去编译这段程序，发现确实没报错，而且我对此数组进行一些操作，结果也都是正确！这简直颠覆了我的知识框架！难道大学老师教我的、我平时看的书，都是错误的吗？！我开始寻找答案...

C 语言中变长数组

最官方的解释应该是 C 语言的规范和编译器的规范说明了。

在 ISO/IEC9899 标准的 6.7.5.2 Array declarators 中明确说明了数组的长度可以为变量的，称为变长数组（VLA，variable length array）。（注：这里的变长指的是数组的长度是在运行时才能决定，但一旦决定在数组的生命周期内就不会再变。）
在 GCC 标准规范的 6.19 Arrays of Variable Length 中指出，作为编译器扩展，GCC 在 C90 模式和 C++ 编译器下遵守 ISO C99 关于变长数组的规范。

这下，终于安心了，原来这种语法确实是 C 语言规范，GCC 非常完美的支持了 ISO C99。但令人遗憾的是，我们的大学老师教给我们的还是老一套，虽然关系不是很大，但这也从侧面反映了我们的教育是多么地滞后！而且我们读的 C 语言书，在不加任何限定的条件下，就说某某语法是不对的，读书的人只能很痛苦地记下！小小吐槽一下，下面继续...

这种变长数组有什么好处呢？你可以使用 alloca 函数达到类似的动态分配数组的效果，但 alloca 函数分配的空间在函数退出时还依然存在，你需要手动地去释放所分配的空间 alloca 函数用来在栈上分配空间，当函数返回时自动释放，无需手动再去释放；VLA 就不一样了，在数组名生命周期结束之后，所分配的空间也就随之释放。

当然，关于 VLA 还有很多限制，例如 ISO/IEC9899 给出了下面这个例子：

extern int n;
int A[n];                           // invalid: ﬁle scope VLA
extern int (*p2)[n];                // invalid: ﬁle scope VM
int B[100];                         // valid: ﬁle scope but not VM
void fvla(int m, int C[m][m]);      // valid: VLA with prototype scope
void fvla(int m, int C[m][m])       // valid: adjusted to auto pointer to VLA
{
    typedef int VLA[m][m];          // valid: block scope typedef VLA
    struct tag {
        int (*y)[n];                // invalid: y not ordinary identiﬁer
        int z[n];                   // invalid: z not ordinary identiﬁer
    };
    int D[m];                       // valid: auto VLA
    static int E[m];                // invalid: static block scope VLA
    extern int F[m];                // invalid: F has linkage and is VLA
    int (*s)[m];                    // valid: auto pointer to VLA
    extern int (*r)[m];             // invalid: r has linkage and points to VLA
    static int (*q)[m] = &B;        // valid: q is a static block pointer to VLA
    }

至于上面语法的原因，请参考 ISO/IEC9899 。

GCC 中零长数组

GCC 中允许使用零长数组，把它作为结构体的最后一个元素非常有用，下面例子出自 gcc 官方文档。

struct line {
    int length;
    char contents[0];
};

struct line *thisline = (struct line *) malloc (sizeof (struct line) + this_length);
thisline->length = this_length;

从上例就可以看出，零长数组在有固定头部的可变对象上非常适用，我们可以根据对象的大小动态地去分配结构体的大小。

在 Linux 内核中也有这种应用，例如由于 PID 命名空间的存在，每个进程 PID 需要映射到所有能看到其的命名空间上，但该进程所在的命名空间在开始并不确定（但至少为 init 命名空间），需要在运行是根据 level 的值来确定，所以在该结构体后面增加了一个长度为 1 的数组（因为至少在一个init命名空间上），使得该结构体 pid 是个可变长的结构体，在运行时根据进程所处的命名空间的 level 来决定 numbers 分配多大。（注：虽然不是零长度的数组，但用法是一样的）

struct pid
{
    atomic_t count;
    unsigned int level;
    /* lists of tasks that use this pid */
    struct hlist_head tasks[PIDTYPE_MAX];
    struct rcu_head rcu;
    struct upid numbers[1];
};

参考资料

ISO/IEC9899
GCC Online Documents

posted @ 2013-10-27 10:18 hazir 阅读(14017) 评论(11) 收藏举报

菜鸟程序员的成长历程

彪悍的人生可以没有妹，但是不能没有技术！

GCC 中零长数组与变长数组

C 语言中变长数组

GCC 中零长数组

参考资料

公告