C语言变长数组data[0]总结
C语言变长数组data[0]
1、前言
今天在看代码中遇到一个结构中包含char data[0],第一次见到时感觉很奇怪,数组的长度怎么可以为零呢?于是上网搜索一下这样的用法的目的,发现在linux内核中,结构体中经常用到data[0]。这样设计的目的是让数组长度是可变的,根据需要进行分配。方便操作,节省空间。
2、data[0]结构
经常遇到的结构形状如下:
struct buffer
{
int data_len; //长度
char data[0]; //起始地址
};
在这个结构中,data是一个数组名;但该数组没有元素;该数组的真实地址紧随结构体buffer之后,而这个地址就是结构体后面数据的地址(如果给这个结构体分配的内容大于这个结构体实际大小,后面多余的部分就是这个data的内容);这种声明方法可以巧妙的实现C语言里的数组扩展。
写个程序对比char data[0],char *data, char data[],如下所示:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdint.h>
typedef struct
{
int data_len;
char data[0];
}buff_st_1;
typedef struct
{
int data_len;
char *data;
} buff_st_2;
typedef struct
{
int data_len;
char data[];
} buff_st_3;
int main()
{
printf("sizeof(buff_st_1)=%u\n", sizeof(buff_st_1));
printf("sizeof(buff_st_2)=%u\n", sizeof(buff_st_2));
printf("sizeof(buff_st_3)=%u\n", sizeof(buff_st_3));
buff_st_1 buff1;
buff_st_2 buff2;
buff_st_3 buff3;
printf("buff1 address:%p,buff1.data_len address:%p,buff1.data address:%p\n",
&buff1, &(buff1.data_len), buff1.data);
printf("buff2 address:%p,buff2.data_len address:%p,buff2.data address:%p\n",
&buff2, &(buff2.data_len), buff2.data);
printf("buff3 address:%p,buff3.data_len address:%p,buff3.data address:%p\n",
&buff3, &(buff3.data_len), buff3.data);
return 0;
}
从结果可以看出data[0]和data[]不占用空间,且地址紧跟在结构后面,而char *data作为指针,占用4个字节,地址不在结构之后。
3、实际当中的用法
在实际程序中,数据的长度很多是未知的,这样通过变长的数组可以方便的节省空间。对指针操作,方便数据类型的转换。测试程序如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdint.h>
typedef struct
{
int data_len;
char data[0];
} buff_st_1;
typedef struct
{
int data_len;
char *data;
} buff_st_2;
typedef struct
{
int data_len;
char data[];
} buff_st_3;
typedef struct
{
uint32_t id;
uint32_t age;
} student_st;
void print_stu(const student_st *stu)
{
printf("id:%u,age:%u\n", stu->id, stu->age);
}
int main()
{
student_st *stu = (student_st *)malloc(sizeof(student_st));
stu->id = 100;
stu->age = 23;
student_st *tmp = NULL;
buff_st_1 *buff1 = (buff_st_1 *)malloc(sizeof(buff_st_1) + sizeof(student_st));
buff1->data_len = sizeof(student_st);
memcpy(buff1->;data, stu, buff1->data_len);
printf("buff1 address:%p, buff1->data_len address:%p, buff1->data address:%p\n",
buff1, &(buff1->data_len), buff1->data);
tmp = (student_st*)buff1->data;
print_stu(tmp);
buff_st_2 *buff2 = (buff_st_2 *)malloc(sizeof(buff_st_2));
buff2->data_len = sizeof(student_st);
buff2->data = (char *)malloc(buff2->data_len);
memcpy(buff2->data, stu, buff2->data_len);
printf("buff2 address:%p, buff2->data_len address:%p, buff2->data address:%p\n",
buff2, &(buff2->data_len), buff2->data);
tmp = (student_st *)buff2->data;
print_stu(tmp);
buff_st_3 *buff3 = (buff_st_3 *)malloc(sizeof(buff_st_3) + sizeof(student_st));
buff3->data_len = sizeof(student_st);
memcpy(buff3->data, stu, buff3->data_len);
printf("buff3 address:%p, buff3->data_len address:%p, buff3->data address:%p\n",
buff3, &(buff3->data_len), buff3->data);
tmp = (student_st*)buff1->data;
print_stu(tmp);
free(buff1);
free(buff2->data);
free(buff2);
free(buff3);
free(stu);
return 0;
}
程序执行结果如下:
采用char *data,需要进行二次分配,操作比较麻烦,很容易造成内存泄漏。而直接采用变长的数组,只需要分配一次,然后进行取值即可以。
GCC 中零长数组
GCC 中允许使用零长数组,把它作为结构体的最后一个元素非常有用,下面例子出自 gcc 官方文档。
struct line {
int length;
char contents[0];
};
struct line thisline = (struct line ) malloc (sizeof (struct line) + this_length);
thisline->length = this_length;
从上例就可以看出,零长数组在有固定头部的可变对象上非常适用,我们可以根据对象的大小动态地去分配结构体的大小。
在 Linux 内核中也有这种应用,例如由于 PID 命名空间的存在,每个进程 PID 需要映射到所有能看到其的命名空间上,但该进程所在的命名空间在开始并不确定(但至少为 init 命名空间),需要在运行是根据 level 的值来确定,所以在该结构体后面增加了一个长度为 1 的数组(因为至少在一个init命名空间上),使得该结构体 pid 是个可变长的结构体,在运行时根据进程所处的命名空间的 level 来决定 numbers 分配多大。(注:虽然不是零长度的数组,但用法是一样的)
struct pid
{
atomic_t count;
unsigned int level;
/* lists of tasks that use this pid */
struct hlist_head tasks[PIDTYPE_MAX];
struct rcu_head rcu;
struct upid numbers[1];
};
本文来自博客园,作者:suntl,转载请注明原文链接:https://www.cnblogs.com/stlong/p/9820802.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~