【转】彻底搞清计算结构体大小和数据对齐原则

数据对齐:

                     许多计算机系统对基本数据类型合法地址做出了一些限制,要求某种类型对象的地址必须是
          某个值K(通常是2,4或8)的倍数。这种对齐限制简化了形成处理器和存储器系统之间的接口的硬件
          设计。例如,假设一个处理器总是从存储器中取出8个字节,则地址必须为8的倍数。如果我们能保
          证将所有的double类型数据的地址对齐成8的倍数,那么就可以用一个存储器操作来读或者写值了。
         否则,我们可能需要执行两次存储器访问,因为对象可能被分放在两个8字节存储块中。
          
         当数据类型为结构体时,编译器可能需要在结构体字段的分配中插入间隙,以保证每个结构元素都
         满足它的对齐要求。而结构本身对它的地址也有一些对齐要求,此时可能需要在结构末尾填充一些
         空间,以满足结构体整体的对齐----向结构体元素中最大的元素对齐。稍后会用代码说明!!!
       
         Linux和Microsoft Windows的对齐方式有何不同:
               一.Linux的对齐策略:
                       在Linux中2字节数据类型(例如short)的地址必须是2的倍数,而较大的数据类型(例如int,int *
               ,float和double)的地址必须是4的倍数。也就是说Linux下要么2字节对齐,要么4字节对齐,没
               有其他格式的对齐。
              二.Microsoft Windows的对齐策略:
                       在Windows中对齐要求更严--任何K字节基本对象的地址都必须是K的倍数,K=2,4,或者8.
            特别地,double或者long long类型数据的地址应该是8的倍数。可以看出Windows的对齐策略和
            Linux还是不同的。稍后用代码说明!!!
          
           接下来用代码和图文说明两者的对齐方式(不同的对齐方式产生的结构体大小不同):
               测试代码如下:
              
 
    /////////////////////////////////////  
    //   filename:DataAlignment  
    /////////////////////////////////////  
    #include<stdio.h>  
      
    typedef struct   
    {  
        char c;  
        int i[2];  
        double v;  
    }S;  
      
    int main()  
    {  
        printf("size of S = %d\n", sizeof(S));  
        return 0;  
    }  

 

 
 
 
         程序中定义了一个结构体,在没有任何数据对齐时内存布局如下:
        
          一.在红帽Linux i686上编译编译后结构S的布局如下:
                                 
           由于要保证结构体每个元素都要数据对齐,因此必须在c和i[0]之间插入3字节的间隙(图中阴影部分为编译器插入的间隙)
           使得i[0]和后面的元素的的偏移量都为4的倍数,这样最终S结构大小为20字节。
                       运行程序结果为:
                           size of S = 20
           
           二.在Microsoft Windows 上编译后S的内存布局如下:
                
                       
         在windows下int类型4个字节,因此int类型要向4字节对齐,double类型8字节,因此要向8字节对齐。因此在
         c和i[0]之间插入3字节的间隙(图中阴影部分),使得i[0]的偏移量为4的倍数,同时在i[1]和v之间插入4字节的间隙,
        使得v的偏移量为8的倍数。这样最终S结构的大小为24字节。
                       运行程序结果为:
                           size of S = 24
          从以上对比可以看出Linux下和windows下的对齐策略是不同的,这就导致在两个平台下结构体的大小不同。
           
         现在考虑如下代码:
              
 
    #include<stdio.h>  
    typedef struct  
    {  
        int i;  
        int j;  
        char c;  
    }S1;  
    int main()  
    {  
       printf("size of S1 = %d\n", sizeof(S1));  
       return 0;  
    }  

 

 
 
 
       可能很多人认为编译后运行结果为9,以为结构体的每个元素都满足各自的对齐要求。其实不然,别忘了还有要考虑
       结构体整体的对齐。假如有如下声明:
              S1  d[4];
       如果这样分配9个字节,不可能满足d的每个元素的对齐要求,因为这些元素的地址分别为xd,xd+9,xd+18,
       xd+27。这样只有第一个元素满足4字节对齐的要求,而其他的元素的地址都不是4的倍数。

      因此编译器会在结构体的末尾填充3字节满足结构体整体的对齐要求,填充后的内存布局如下:
       
                      这样一来,d的元素的地址分别为xd,xd+12,xd+24,xd+36,满足4字节的整数倍,这样最终S1的大小
                      为12字节,而不是9字节.

                   总结:通过代码的对比,可以看出Linx和Windwos的数据对齐有所差异,这就导致
        在一些情况下两者平台结构体类型大小的不同。通过以上示例分析我们可以很简单的
        计算出在任何平台下结构体的大小。读者可以找相关的练习题继续练习下,验证结果
        的正确性。相信仔细阅读本文应该能搞定所有类似的问题!!!
 
 
 
原文地址:http://blog.csdn.net/qianghaohao/article/details/51011418
 
 
posted @ 2016-09-22 11:03  lulipro  阅读(661)  评论(0编辑  收藏  举报