有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。
例如在存放一个开关量时,只有0和1 两种状态, 用一位二进位即可。
为了节省存储空间并使处理简便,C语言又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几个不同的区域并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。 这样就可以把几个不同的对象用一个字节的二进制位域来表示。
1.位域的声明
位域变量的声明与结构变量声明的方式相同。 如:
Struct sample{
int a:7; //类型说明符 位域名:位域长度
int b:2;
int c:6;
}data;
其中,data为sample变量,共占两个字节。其中位域a占第一个字节的7位,位域b占第二个字节的低2位,位域c占第二个字节的高6位。
2.位域的对齐
如果结构体中含有位域(bit-field),那么VC中准则是:
1) 如果相邻位域字段的类型相同且其位宽之和小于声明数据类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
2) 如果相邻位域字段的类型相同但其位宽之和大于类型的sizeof大小(如:char 的位域长度不能超过8,int的字节长度不能超过32),则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
3) 如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式(不同位域字段存放在不同的位域类型字节中),Dev-C++和GCC都采取压缩方式;
系统会先为结构体成员按照对齐方式分配空间和填塞(padding),然后对变量进行位域操作。
位域可以有无位域名,这时它只用来作填充或调整位置。无名的位域是不能使用的。例如:
Struct sample{
char a:7; //类型说明符 位域名:位域长度
char b:2;
char :2;
char c:2 //无位域名的位数 直接跳过且这2位不能使用
}data;
#include <stdio.h>
#include <stdlib.h>
#include <memory.h>
struct A{ //结构体字节长度为8
char a:8; //占用第一个字节的8位
unsigned int b:5; //占用第五个字节的低5位
unsigned int c:3; //占用第五个字节的高3位
};
int main()
{
char testArry[10] = "0123456789";
char testB[10] = {0};
struct A d;
memcpy(&d, testArry, sizeof(d));
printf("%d ", sizeof(d));
p rintf("%d ", d.a);
printf("%d ", d.b);
printf("%d ", d.c);
system("pause");
return 0;
}
编译运行输出结果:8 48 20 1
00110111 00110110 00110101 00110100 00110011 00110010 00110001 00110000
位段(bit-field)是以位为单位来定义结构体(或联合体)中的成员变量所占的空间。含有位段的结构体(联合体)称为位段结构。采用位段结构既能够节省空间,又方便于操作。
位段的定义格式为:
type [var]: digits
其中type只能为int,unsigned int,signed int三种类型(int型能不能表示负数视编译器而定,比如VC中int就默认是signed int,能够表示负数)。位段名称var是可选参数,即可以省略。digits表示该位段所占的二进制位数。
那么定义一个位段结构可以像下面这段代码去定义:
struct node
{
unsigned int a:4; //位段a,占4位
unsigned int :0; //无名位段,占0位
unsigned int b:4; //位段b,占4位
int c:32; //位段c,占32位
int :6; //无名位段,占6位
};
一.位段的使用
使用位段需注意一下几点:
1)位段的类型只能是int,unsigned int,signed int三种类型,不能是char型或者浮点型;
2)位段占的二进制位数不能超过该基本类型所能表示的最大位数,比如在VC中int是占4个字节,那么最多只能是32位;
3)无名位段不能被访问,但是会占据空间;
4)不能对位段进行取地址操作;
5)若位段占的二进制位数为0,则这个位段必须是无名位段,下一个位段从下一个位段存储单元(这里的位段存储单元经测试在VC环境下是4个字节)开始存放;
6)若位段出现在表达式中,则会自动进行整型升级,自动转换为int型或者unsigned int。
7)对位段赋值时,最好不要超过位段所能表示的最大范围,否则可能会造成意想不到的结果。
8)位段不能出现数组的形式。
二.位段结构在内存中的存储方式
对于位段结构,编译器会自动进行存储空间的优化,主要有这几条原则:
1)如果一个位段存储单元能够存储得下位段结构中的所有成员,那么位段结构中的所有成员只能放在一个位段存储单元中,不能放在两个位段存储单元中;如果一个位段存储单元不能容纳下位段结构中的所有成员,那么从剩余的位段从下一个位段存储单元开始存放。(在VC中位段存储单元的大小是4字节).
2)如果一个位段结构中只有一个占有0位的无名位段,则只占1或0字节的空间(C语言中是占0字节,而C++中占1字节);否则其他任何情况下,一个位段结构所占的空间至少是一个位段存储单元的大小;
测试程序:
/*测试位段 201110.12*/
#include<iostream>
using namespace std;
typedef struct node
{
unsigned int a:1; //存在一个非0位的位段,则至少占4Byte
}S;
typedef struct node1 //在C++中占1字节的空间 ,在C中占0字节
{
unsigned int :0;
}S1;
typedef struct node2
{
unsigned int a:1;
unsigned int :0; //下一个位段放在一个新的位段存储单元 ,所以占4+4=8Byte
unsigned c:32;
}S2;
typedef struct node3
{
unsigned int a:4;
unsigned int :0;
int :6; //这个位段放在一个新的位段存储单元
unsigned c:32; //由于6+32>32,所位段c也放在一个新的位段存储单元,所以占4+4+4=12Byte
}S3;
typedef struct node4
{
unsigned int a:1;
char b; //在一个位段存储单元中能够存下所有的成员,所以占4Byte
int c:1;
int d:2;
unsigned int e:2;
}S4;
int main(int argc, char *argv[])
{
S4 s4;
s4.a=1;
s4.c=1;
s4.d=2;
s4.e=3;
printf("%d %d %d %d\n",s4.a,s4.c,s4.d,s4.e);
printf("%d %d %d %d %d\n",sizeof(S),sizeof(S1),sizeof(S2),sizeof(S3),sizeof(S4));
return 0;
}
执行结果为:
1 -1 -2 3
4 1 8 12 4
请按任意键继续. . .
当打印s4的各个位段时,打印的结果与赋的初始值不同。
由于c只占1位,那么没有数据位,此时进行符号扩展直接在高位添加1,所以打印的结果为-1;
由于d占2位,那么当将2赋给d时,内存中存储的内容为10,此时进行符号扩展,高位补1,则为0XFF FF FF FE,那么其真值则为-2.