C++位域和内存对齐问题

1. 位域:

1. 在C中,位域可以写成这样(注:位域的数据类型一律用无符号的,纪律性)。
1 struct bitmap
2 {
3   unsigned a : 1;
4   unsigned b : 3;
5   unsigned c : 4;
6 }bit;
  sizeof(bitmap) == 4;(整个struct的大小为4,因为位域本质上是从一个数据类型分出来的,在我们的例子中数据类型就是unsigned,大小为4,并且位域也是满足C和C++的结构体内存对齐原则的,等下我们会说到)。
2. 当然了位域也可以有空域。
1 struct bitmap
2 {
3   unsigned a:4;
4   unsigned :0; /*空域*/
5   unsigned b:4; /*从下一单元开始存放*/
6   unsigned c:4;
7 }
8 sizeof(bitmap) == 8;
3. 在这个位域定义中,a占第一字节的4位,后4位填0表示不使用,b从第二字节开始,占用4位,c占用4位。这里我们可以看到空域的作用是填充数据类型的剩下的位置,有时候我们只是想调整一下内存分配,则我们可以使用无名位域:
1 struct bitmap
2 {
3   unsigned a:1;
4   unsigned :2;
5   unsigned b:3;
6   unsigned c:2;
7 };
8 sizeof(bitmap) == 4;
4. 如果一个位域的位的分配超过了该类型的位的总数,则从下一个单元开始继续分配,这个很好理解:
1 struct bitmap
2 {
3   unsigned a : 8;
4   unsigned b : 30;
5   unsigned c : 4;
6 };
7 sizeof(bitmap) == 12;
  注意这个位域的大小是12而不是8,说明如果超了大小是立马从下一个单元开始分配而不是cast在后面。
 
5. C++的位域:
  由于C++有类,所以呢位域可以写进类里面,很简单比如:
1 class Demo
2 {
3   unsigned mode : 8;
4   unsigned modeifed : 2;
5   unsigned protA : 3;
6   unsigned protB : 4;
7 public:
8 ...
9 };
  另外就是需要注意的是,取地址运算符不能作用于位域,所以任何指针都无法指向类的位域,访问位域的方法和访问类的成员的方法一样,这里就不多说了。
 
2. 内存对齐:

1. 说到位域就不得说下内存对齐的东西,其实内存对齐也很简单,只是不同的编译器实现不一样,至于为什么要内存对齐,这个要从CPU的基本工作原理说起,但是首先要明白,无论我们是否内存对齐,CPU大多数情况都是能正常工作的(前提:对于大多数IA32指令都可以这么说,但是部分指令,如SSE多媒体指令这些就不行,这些指令有特殊内存对齐要求,比如16字节对齐,任何不满足内存对齐的地址访问储存器都是会导致异常,对于这些指令,编译器必须在编译的时候采取强制内存对齐)。
 
  实现内存对齐可以提高CPU的性能,比如处理器能一次取出8个字节,这个时候必须要求数据地址要8字节对齐,这个是和CPU和储存器的外围电路决定的,在内存对齐的情况下,CPU从储存器取出这8个字节只需要一个时钟周期,但是如果这个地址不是8字节对齐,那么CPU可能就需要两个时钟周期才能取出这8个字节。
  对于IA32,每个栈帧都惯例16字节对齐,编译器一般也会那么做,但是对于数据类型不同的编译器表现可能不一样,对于Windows(VC编译器),任何K字节的基本对象的地址都必须是K的倍数(比如对于int,必须4字节对齐,对于double,必须8字节对齐),这很大程度上提高了储存器和CPU的工作性能,但是对存储空间的浪费比较严重;对于Linux,惯例是8字节数对齐4字节边界(比如double可以4字节对齐)。对于Windows好Linux,数据类型long double都有4字节对其的要求,对于GCC,long double分配12字节(虽然它只占10字节大小)。
  所以我们有一般规则(在知乎找了个例子):
1 struct X
2 {
3   char a;
4   float b;
5   int c;
6   double d;
7   unsigned e;
8 };
9 sizeof(X) == 32;
  内存对齐状况应该是下面这个样子:
 1 struct X
 2 {
 3   char a; // 1 bytes
 4   char padding1[3]; // 3 bytes
 5   float b; // 4 bytes
 6   int c; // 4 bytes
 7   char padding2[4]; // 4 bytes
 8   double d; // 8 bytes
 9   unsigned e; // 4 bytes
10   char padding3[4]; // 4 bytes
11 };
12 sizeof(X) == 32;
  (其中最后的4个字节的填充是因为规则4,看下面)。
 
2. 如果自定义数据类型含有位域,则内存对齐满足以下原则:
  1. 如果相邻的位域的数据类型相同,则按照分配位的大小来,详情看我上面写的位域的第5个情况。
  2. 如果相邻的位域的数据类型不相同,则不同编译器实现不一样,有些编译器选择不压缩。
  3. 如果位域不连续,中间含非位域,则按标准数据类型大小划分,比如:
1 struct bitmap
2 {
3   unsigned a : 2;
4   int b;
5   unsigned c : 3;
6 };
7 sizeof(bitmap) == 12;
3. 另外可以通过添加#pragma pack(n)来强制改变内存分配情况,比如在VC编译器中:
1 struct bitmap
2 {
3   unsigned a;
4   double c;
5 };
6 sizeof(bitmap) == 16;
  加了#pragma pack(4),则强制内存对齐4字节,再测试下其大小:
1 #pragma pack(4)
2 struct bitmap
3 {
4   unsigned a;
5   double c;
6 };
7 sizeof(bitmap) == 12;
  当然,如果#pragma pack(n)的n大于本身数据类型的宽度,则按数据类型的宽度来分配:
1 struct bitmap
2 {
3   double c;
4   int k;
5   int m;
6 };
7 sizeof(bitmap) == 16 != 32
4. 自定义类型(C结构体,C++聚合类)的最后的内存对齐,是按照自定义类型内的最大类型的宽度来的,比如上面那个例子去掉int m:
1 struct bitmap
2 {
3   double c;
4   int k;
5 };
6 sizeof(bitmap) == 16
  必须以double进行8字节对齐(VC编译器)。
 
5. 对于C++如果类内有虚函数,则如果存在虚函数,则需要添加一个指针的大小(因为需要一个指针指向虚函数指针表,注意如果存在多个虚函数,也只有一个指向虚函数表指针),比如在32位系统则为4字节,在64位则为8字节。
1 class Test
2 {
3 public:
4     virtual void Hi();
5  
6     int c;
7     double d;
8 };
9 sizeof(Test) == 16(IA32)或者 24(x86-64
  特别的,在C++内,空类大小为1(C++不允许0的内存空间)。
class Test
{
};
sizeof(Test) == 1;
6. 如果一个类(结构体)A内嵌套着另一个类(结构体)B,则B按B内的最大类型的方式对齐,A的对齐要考虑B(总大小的对齐要考虑B的最大类型)
 1 class A
 2 {
 3     double c;
 4 public:
 5     class B
 6     {
 7         int i;
 8         double c;
 9     }b;
10     int d;
11 };
12 sizeof(A) == 32   sizeof(A::B) == 16

 

7. C++的类静态成员不会被sizeof计算,这个要注意:

class C
{
public:
    static char b;
    static int *c; 
};

sizeof(C)的结果是1

 

 
posted @ 2016-08-25 02:54  PhiliAI  阅读(1758)  评论(0编辑  收藏  举报