C++ 内存对齐与分布

内存对齐

理论上，32位系统下，int占4byte，char占一个byte，那么将它们放到一个结构体中应该占4+1=5byte；但是实际上，通过运行程序得到的结果是8 byte，这就是内存对齐所导致的。

现代计算机中内存空间都是按照 byte 划分的，从理论上讲似乎对任何类型的变量的访问可以从任何地址开始，但是实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k（通常它为4或8）的倍数，这就是所谓的内存对齐。

为什么？

尽管内存是以字节为单位，但是大部分处理器并不是按字节块来存取内存的.它一般会以双字节,四字节,8字节,16字节甚至32字节为单位来存取内存，我们将上述这些存取单位称为内存存取粒度。

现在考虑4字节存取粒度的处理器取int类型变量（32位系统），该处理器只能从地址为4的倍数的内存开始读取数据。

假如没有内存对齐机制，数据可以任意存放，现在一个int变量存放在从地址1开始的联系四个字节地址中，该处理器去取数据时，要先从0地址开始读取第一个4字节块,剔除不想要的字节（0地址）,然后从地址4开始读取下一个4字节块,同样剔除不要的数据（5，6，7地址）,最后留下的两块数据合并放入寄存器.这需要做很多工作。

现在有了内存对齐的，int类型数据只能存放在按照对齐规则的内存中，比如说0地址开始的内存。那么现在该处理器在取数据时一次性就能将数据读出来了，而且不需要做额外的操作，提高了效率。

内存对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”（也叫对齐模数）。gcc中默认#pragma pack(4)，可以通过预编译命令#pragma pack(n)，n = 1,2,4,8,16来改变这一系数。

有效对齐值：是给定值#pragma pack(n)和结构体中最长数据类型长度中较小的那个。有效对齐值也叫对齐单位。

了解了上面的概念后，我们现在可以来看看内存对齐需要遵循的规则：

(1) 结构体第一个成员的偏移量（offset）为0，以后每个成员相对于结构体首地址的 offset 都是该成员大小与有效对齐值中较小那个的整数倍，如有需要编译器会在成员之间加上填充字节。

(2) 结构体的总大小为有效对齐值的整数倍，如有需要编译器会在最末一个成员之后加上填充字节。

struct s2{
    char c1;
    int i;
    char c2;            
};

linux下默认#pragma pack(4)，且结构体中最长的数据类型为4个字节，所以有效对齐单位为4字节，下面根据上面所说的规则以s2来分析其内存布局：

首先使用规则1，对成员变量进行对齐：

sizeof(c1) = 1 <= 4(有效对齐位)，按照1字节对齐，占用第0单元；

sizeof(i) = 4 <= 4(有效对齐位)，相对于结构体首地址的偏移要为4的倍数，占用第4，5，6，7单元；

sizeof(c2) = 1 <= 4(有效对齐位)，相对于结构体首地址的偏移要为1的倍数，占用第8单元；

然后使用规则2，对结构体整体进行对齐：

s2中变量i占用内存最大占4字节，而有效对齐单位也为4字节，两者较小值就是4字节。因此整体也是按照4字节对齐。由规则1得到s2占9个字节，此处再按照规则2进行整体的4字节对齐，所以整个结构体占用12个字节。

不同平台上编译器的 pragma pack 默认值不同。而我们可以通过预编译命令#pragma pack(n), n= 1,2,4,8,16来改变对齐系数。

对齐实例：

C++的空类、以及没有虚函数和非静态变量的类：

空类

对于一个什么都没有的空类，实际并不是空的，因为有虚设的字节，具体可以参考为什么C++ 中空类的大小是1个字节？，大小是 1，这是因为需要有一个地址，C++ 不允许两个不同的对象有相同的地址，所以 C++ 中空的类和结构体大小都是 1。

加入成员函数、静态成员函数、静态成员变量：

当我们显示加入了新的成员函数、静态成员函数、静态成员变量后，类的大小还是 1。也就是成员函数、静态成员函数、静态成员变量都是不占用类的内存的，这是因为这些东西都不是类的，也不是每个对象分别存储。static 变量就是存储在全局静态区。

C++类的内存分布（变量）

C++ 中会影响一个类的对象的大小的，就是非静态成员变量和虚函数。

在 C++ 中每个类型都有两个属性，一个是大小（size），还有一个就是对齐要求（alignment requirement），或称之为对齐量（alignment）。C++标准并没有规定每个类型的对齐量，但是一般都会有这样的规律：

　　1.所有基础类型的对齐量等于这个类型的大小。

　　2.struct, class, union 类型的对齐量等于其中非静态成员变量中最大的对齐量。

　　3.标准规定所有的对齐量必须是 2 的幂次。

　　4.编译器在给一个变量分配内存时，都要算出并满足这个类型的对齐要求。struct 和 class 类型的非静态成员变量的字节数偏移（offset）也要满足各自类型的对齐要求。

C++类的内存分布（虚函数）

一个类中有虚函数时内存分布

C++ 的类中，除了虚函数以外的所有函数，都是不占类的内存的，但是如果类有了虚函数，类内就会有一个虚函数表的指针 _vptr，指向自己的虚函数表，vptr 一般都是在类的最前边。

由于只是存一个指向虚函数表的指针，所以不管有多少个虚函数，都是 4 字节大小（32位下，任何指针大小都是 4，64位下，任何指针大小都是 8）。

继承关系中的有虚函数时的内存分布

最关键的一个点就是，对于没有 override 的虚函数，基类和子类中 _vptr 指向的虚函数表中，这个虚函数的地址是一样的；而对于重写了的或者默认重写的析构函数来说，_vptr 指向的虚函数表中，函数地址是不一样的（当然两个类的 _vptr 地址也是不一样的，这是肯定的），这就能窥探到多态的实现了。

posted @ 2021-08-29 20:07 默行于世阅读(216) 评论(0) 收藏举报

刷新页面返回顶部

默行于世

C++ 内存对齐与分布

公告