[C/C++] 结构体内存对齐用法

一.为什么要内存对齐

  经过内存对齐之后,CPU的内存访问速度大大提升;

  内存空间按照byte划分,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

  各个硬件平台对存储空间的处理上有很大的不同。如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。
比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,
就可能会需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该int数据。显然在读取效率上下降很多。这也是空间和时间的取舍;
链接: https://www.cnblogs.com/jijiji/p/4854581.html
 

二. 内存对齐原则

1、数据成员对齐规则:结构(struct或联合union)的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置: min(#pragma pack()指定的数,这个数据成员的自身长度)的倍数

2、结构体作为成员:如果一个结构里有某些结构体成员,则结构体成员要从min(#pragram pack() , 内部长度最长的数据成员)的整数倍地址开始存储。(struct a里存有struct b,b里有char,int,double等元素,那b应该从min(#pragram pack(), 8)的整数倍开始存储。)

3、结构体的总大小,也就是sizeof的结果,必须是 min(#pragram pack() , 长度最长的数据成员) 的整数倍

#pragram pack() 默认为4(32位), 8(64位)

三. 用例

// #pragma pack(4)
struct s1{
    double b;
    char a;
} s1;
struct s2{
    char a;
    double b;
} s2;

typedef struct s3{
    char a;
    int b;
    double c;
} s3;
typedef struct s4{
    char a;
    double c;
    int b;
} s4;

struct s5{
    char a;
    s3 s;
    int b;
} s5;
struct s6{
    char a;
    s4 s;
    int b;
} s6;
加上 #pragma pack(4): 
  s1-s6 : 12, 12, 16, 16, 24, 24
不加 #pragma pack(4):(64位默认8):
  s1-s6 : 16, 16, 16, 24, 32, 40

特别注意的是: c结构体中不允许定义static变量; C++结构体中可以定义static变量,sizeof时不计算该变量, 但需注意初始化格式,

C++ sizeof几种变量的计算方法: https://blog.csdn.net/lime1991/article/details/44536343


四. 更改编译器缺省字节对齐方式方法


法1. #pragma pack()用法
#pragma pack(n) /*指定按n字节对齐,等价于#pragma pack(push,n), n必须为2的n次方,否则编译器可能会报错*/
#pragma pack() /*取消指定对齐,恢复缺省对齐,等价于#pragma pack(pop)*/
链接:https://baike.baidu.com/item/%23pragma%20pack/3338249  参数介绍

法2.__attribute__((packed))用法
__attribute__((aligned(n))) // 让所作用的数据成员对齐在n字节的自然边界上;如果结构中有成员的长度大于n,则按照最大成员的长度来对齐;
__attribute__((packed)) // 取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐
注意: 两个括号不能少

用例:
typedef struct s2{
    char a;
    int b;
    double c;
} __attribute__((aligned(4))) s2;
typedef struct  __attribute__((packed)) s2{
    char a;
    double c;
    int b;
}  s2;

五. 位域类型用法
注意,结构体内可以定义:位域类型; 位域类型没怎么接触过,有时间的话专门写一篇进行下详细了解;
参考链接: https://www.cnblogs.com/tsw123/p/5837273.html
struct A1{
    char f1 : 3;
    char f2 : 4;
    char f3 : 5;
}A1;
struct A2{
    char f1 : 3;
    char f2 ;
    char f3 : 5;
}A2;
struct A3{
    char f1 : 3;
    short f2 ;
    char f3 : 5;
}A3;
struct A4{
    char f1 : 3;
    int f2 : 5;
    char f3 : 5;
}A4;

sizeof结果

A1-A4:  2, 3, 6, 4

 

六 常见的几种误用

#pragma pack(4)

typedef struct s00{
char b;
int a; } s00;
char c_temp[10] = "123456789"; s00 s_temp = { 0x09, 0x12345678};

此时, sizeof(s_temp) = 8, 内存中((char*)&s_temp)[0-7] = 0x09, 0x00,0x00,0x00,0x78,0x56,0x34,0x12 ;

1.  memset(&s_temp, 0, sizeof(s_temp));

此时,memset会将8个字节都设为0, 在这里由于struct s_temp一般为malloc申请空间, malloc(sizeof(s00)), 默认申请为8个字节, 所以memset不会出错;

若直接定义结构体s00 s_temp, 需考虑a后三个字节值可能不定,默认为0;

 2. (s00*)c_temp;

若是将一个char*的数组强转为s00, 该数组没有考虑b后的三个空字符,那么强转后参数就会出错,

假设 c_temp[0-7] = 0x78,0x56,0x34,0x12, 0x09, 0x00,0x00,0x00

若s00,定义int在前,char在后;   此时a = 0x12345678, b = 0x09;  // 正确,

若s00,定义char在前,int在后,此时b = 0x78, a = 0x09;    // 错误,

3. memcpy(c_temp, (char *)&s_temp, sizeof(s_temp)); //最容易出错

 本意只想将s_temp的5个字节数据复制到c_temp, 但sizeof = 8, copy了8个字节, 会导致c_temp出错;

此时c_temp[0-9] = 0x09, 0x00,0x00,0x00, 0x78,0x56,0x34,0x12, 0x39, 0x00; // 0x39 = '9'

 
其他

结构体定义方法
struct 类型名{
    成员表列
} 变量;
struct 类型名 变量;

typedef struct 类型名{
    成员表列
} 别名;
别名 变量;

基本数据类型所占内存大小

 

 

posted @ 2018-04-14 17:47  我自逍遥笑  阅读(5397)  评论(0编辑  收藏  举报