C++ 中类的内存布局

在许多笔试面试中都会涉及到sizeof 运算符的求值问题。

这类问题主要分四类：

基本数据类型，如int，bool，fload，long，long，int * 等，这一类比较简单，但要注意x86和x64情况下的指针大小
枚举 enum。这个类型网络上有说是1-4个byte，根据最大值决定的；也有说是sizeof(int)。我这边个人使用 visual studio 2015 获得的结果是4个byte
struct 和 union 组合类型。union 是取其中一个最大成员的size作为其size；struct 则要考虑对齐填充因素
class 类型，class 就稍微复杂点，不仅仅要考虑对齐填充因素，还要考虑继承，虚继承，虚函数等因素。

下文主要讲述class 的内存布局，稍带介绍一下struct 的size。

struct 的内存布局：

struct 的内存对齐和填充概念学过C 的都应该知道一点。其实只要记住一个概念和三个原则就可以了：

一个概念：

　　自然对齐：如果一个变量的内存地址正好位于它长度的整数倍，就被称做自然对齐。

　　如果不自然对齐，会带来CPU存取数据时的性能损失。（PS：具体应该与CPU通过总线读写内存数据的细节相关，具体没有细究）

三个原则：

struct 的起始地址需要能够被其成员中最宽的基本数据类型整除；
struct 的size 也必须能够被其成员中最宽的基本数据类型整除；
struct 中每个成员地址相对于struct 的起始地址的offset，必须是自然对齐的。

Class 的内存布局：

在学习C++ 的class 的内存布局前，先介绍下文会被用到的Visual studio 中的编译选项"/d1reportAllClassLayout" 和 "/d1reportSingleClassLayout[ClassName]"。

这两个编译选项分别会输出当前编译单元中所以class 的内存布局和指定class 的内存布局。对于学习class 的内存布局很方便。

关于一个class 的定义，在定义过程中涉及到的有：

　　成员数据（静态，非静态）和成员函数（静态，非静态，virtual）。

所有的成员函数都不会占用对象的存储空间，无论是静态，非静态还是虚函数。

而对于成员数据来说，只有非静态的数据才会占用对象的存储空间。

这个很好理解，静态成员数据和成员函数是属于class 的，而非属于具体的对象，所以只要维护一份内存就可以了，无需每个对象都拷贝一份。

但是影响对象的大小的因素并不仅仅与看到的成员变量有关：

　　非静态成员变量，虚函数表指针(_vftprt)，虚基类表指针(_vbtptr)，上文的内存对齐

空类

class CEmpty{};

　　对于空类，许多人想当然的认为大小应该是0。这是错误的，如果是正确的话，这个类可以被实例化成一个对象，且这个对象不占任何存储空间，且可以有很多不占任何空间的对象，而且这个不占空间的对象还可以有指针，这样就很奇怪了。

　　所以正常编译器会给空类分配1个byte 的空间用于标示。

　　sizeof(CEmpty) = 1

普通类

class CBase {
public:
	int m_ia;
	static int s_ib;
private:
	void f();
	void g();
};

　　其类的布局如下：

class CBase	size(4):
	+---
 0	| m_ia
	+---

　　只有m_ia 成员，size 为4个byte。因为静态数据成员和成员函数不占有对象空间。

有虚函数的类

class CBase {
public:
	int m_ia;
private:
	void f();
	void g();
	virtual void h();
};

　　其类的布局如下：

class CBase	size(8):
	+---
 0	| {vfptr}
 4	| m_ia
	+---

CBase::$vftable@:
	| &CBase_meta
	|  0
 0	| &CBase::h

　　可以看到该类的起始地址是放了一个"vfptr"，这个指针用来指向该类的虚函数表。

单一继承的类(无虚函数)

class CBase {
public:
	int m_ia;
private:
	void f();
	void g();
};

class CChild :public CBase {
public:
	int m_iChild;
};

　　类的布局如下：

class CChild	size(8):
	+---
	| +--- (base class CBase)
 0	| | m_ia
	| +---
 4	| m_iChild
	+---

　　即派生类中拷贝了一份基类中的成员数据，所以size 为8个byte。

单一继承的类（含有虚函数）

class CBase {
public:
	int m_ia;
public:
	virtual ~CBase();
	virtual void f();
	virtual void g();
};

class CChild :public CBase {
public:
	int m_iChild;
public:
	virtual ~CChild();
	virtual void g();
};

　　其类的布局如下：

class CChild	size(12):
	+---
	| +--- (base class CBase)
 0	| | {vfptr}
 4	| | m_ia
	| +---
 8	| m_iChild
	+---

CChild::$vftable@:
	| &CChild_meta
	|  0
 0	| &CChild::{dtor} 
 1	| &CBase::f 
 2	| &CChild::g

　　可以看到派生类中只有一个"vfptr"，但是虚函数表中的函数却不同于基类中的函数，没有重写的虚函数沿用基类中的虚函数，而被重写的虚函数则更新为派生类中的虚函数。

多重继承的类（基类都含有虚函数）

class CBase1 {
public:
	int m_i1;
public:
	virtual ~CBase1();
	virtual void f1();
	virtual void g1();
};

class CBase2 {
public:
	int m_i2;
public:
	virtual ~CBase2();
	virtual void f2();
	virtual void g2();
};

class CChild :public CBase1, public CBase2 {
public:
	int m_iChild;
public:
	virtual ~CChild();
	virtual void f1();
	virtual void g2();
};

　　其类的布局如下：

class CChild	size(20):
	+---
	| +--- (base class CBase1)
 0	| | {vfptr}
 4	| | m_i1
	| +---
	| +--- (base class CBase2)
 8	| | {vfptr}
12	| | m_i2
	| +---
16	| m_iChild
	+---

CChild::$vftable@CBase1@:
	| &CChild_meta
	|  0
 0	| &CChild::{dtor} 
 1	| &CChild::f1 
 2	| &CBase1::g1 

CChild::$vftable@CBase2@:
	| -8
 0	| &thunk: this-=8; goto CChild::{dtor} 
 1	| &CBase2::f2 
 2	| &CChild::g2

　　CChild 分别从CBase1 和 CBase 中继承一个vfptr.

菱形结构继承的类（非虚继承）

class CBase {
public:
	int m_iBase;
public:
	virtual ~CBase();
	virtual void f0();
	virtual void g0();
	virtual void h0();
};

class CChild1:public CBase {
public:
	int m_iChild1;
public:
	virtual ~CChild1();
	virtual void f0();
	virtual void h1();
};

class CChild2:public CBase {
public:
	int m_iChild2;
public:
	~CChild2();
	void g0();
	void h1();
};

class CGrandChild :public CChild1, public CChild2 {
public:
	int m_iGrandChild;
public:
	virtual ~CGrandChild();
	virtual void h0();
	virtual void h1();
	virtual void h2();
	virtual void f0();
};

　　其类的布局如下：

class CGrandChild	size(28):
	+---
	| +--- (base class CChild1)
	| | +--- (base class CBase)
 0	| | | {vfptr}
 4	| | | m_iBase
	| | +---
 8	| | m_iChild1
	| +---
	| +--- (base class CChild2)
	| | +--- (base class CBase)
12	| | | {vfptr}
16	| | | m_iBase
	| | +---
20	| | m_iChild2
	| +---
24	| m_iGrandChild
	+---

CGrandChild::$vftable@CChild1@:
	| &CGrandChild_meta
	|  0
 0	| &CGrandChild::{dtor} 
 1	| &CGrandChild::f0 
 2	| &CBase::g0 
 3	| &CGrandChild::h0 
 4	| &CGrandChild::h1 
 5	| &CGrandChild::h2 

CGrandChild::$vftable@CChild2@:
	| -12
 0	| &thunk: this-=12; goto CGrandChild::{dtor} 
 1	| &thunk: this-=12; goto CGrandChild::f0 
 2	| &CChild2::g0 
 3	| &thunk: this-=12; goto CGrandChild::h0

　　这种继承是有风险的，即通过CGrandChild 去访问m_iBase 时，容易造成二义性，需要使用"pGrandChild->CChild::m_iBase" 这种方法去访问。

　　为了避免这种问题，C++ 中有一种机制是虚继承。

单一虚继承

class CBase {
public:
	int m_iBase;
public:
	virtual ~CBase();
	virtual void f0();
	virtual void g0();
	virtual void h0();
};

class CChild1: virtual public CBase {
public:
	int m_iChild1;
public:
	virtual ~CChild1();
	virtual void f0();
	virtual void h1();
};

　　其类的布局如下：

class CChild1	size(24):
	+---
 0	| {vfptr}
 4	| {vbptr}
 8	| m_iChild1
	+---
12	| (vtordisp for vbase CBase)
	+--- (virtual base CBase)
16	| {vfptr}
20	| m_iBase
	+---

CChild1::$vftable@CChild1@:
	| &CChild1_meta
	|  0
 0	| &CChild1::h1 

CChild1::$vbtable@:
 0	| -4
 1	| 12 (CChild1d(CChild1+4)CBase)

CChild1::$vftable@CBase@:
	| -16
 0	| &(vtordisp) CChild1::{dtor} 
 1	| &(vtordisp) CChild1::f0 
 2	| &CBase::g0 
 3	| &CBase::h0

　　从布局中看，发现多了一个vbptr 指针，则是一个指向基类的虚基类指针；在派生类和虚基类之间又多了“vtordisp for vbase CBase”，vtordisp 并不是每个虚继承的派生类都会生成的，关于这部分可以参考MSDN 中 vtordisp；在vtordisp 后面则是虚基类的一个拷贝。

多重继承的类（虚继承）

class CChild1 {
public:
	int m_iChild1;
public:
	virtual ~CChild1();
	virtual void f0();
	virtual void h1();
};

class CChild2 {
public:
	int m_iChild2;
public:
	~CChild2();
	void g0();
	void h1();
};

class CGrandChild :public CChild1, public CChild2 {
public:
	int m_iGrandChild;
public:
	virtual ~CGrandChild();
	virtual void h0();
	virtual void h1();
	virtual void h2();
	virtual void f0();
};

　　virtual public Child1, public CChild2

　　　　其类的布局如下：

class CGrandChild	size(28):
	+---
 0	| {vfptr}
	| +--- (base class CChild2)
 4	| | m_iChild2
	| +---
 8	| {vbptr}
12	| m_iGrandChild
	+---
16	| (vtordisp for vbase CChild1)
	+--- (virtual base CChild1)
20	| {vfptr}
24	| m_iChild1
	+---

　　public Child1, virtual public CChild2

　　　　其类的布局如下：

class CGrandChild	size(20):
	+---
	| +--- (base class CChild1)
 0	| | {vfptr}
 4	| | m_iChild1
	| +---
 8	| {vbptr}
12	| m_iGrandChild
	+---
	+--- (virtual base CChild2)
16	| m_iChild2
	+---

　　virtual public Child1, virtual public CChild2

class CGrandChild	size(28):
	+---
 0	| {vfptr}
 4	| {vbptr}
 8	| m_iGrandChild
	+---
12	| (vtordisp for vbase CChild1)
	+--- (virtual base CChild1)
16	| {vfptr}
20	| m_iChild1
	+---
	+--- (virtual base CChild2)
24	| m_iChild2
	+---

　　通过上述虚继承的情况来看，可以看出有虚继承的派生类中，派生类和虚基类的数据是完全隔开的，先存放派生类自己的虚函数指针，虚基类指针和数据；然后有vtordisp 作为间隔；在存放虚基类的内容。

菱形结构继承的类（虚继承）

class CBase {
public:
	int m_iBase;
public:
	virtual ~CBase();
	virtual void f0();
	virtual void g0();
	virtual void h0();
};

class CChild1 : virtual public CBase {
public:
	int m_iChild1;
public:
	virtual ~CChild1();
	virtual void f0();
	virtual void h1();
};

class CChild2 : virtual public CBase{
public:
	int m_iChild2;
public:
	virtual ~CChild2();
	virtual void g0();
	virtual void h1();
};

class CGrandChild : public CChild1, public CChild2 {
public:
	int m_iGrandChild;
public:
	virtual ~CGrandChild();
	virtual void h0();
	virtual void h1();
	virtual void h2();
	virtual void f0();
};

　　其类的布局如下：

class CGrandChild	size(40):
	+---
	| +--- (base class CChild1)
 0	| | {vfptr}
 4	| | {vbptr}
 8	| | m_iChild1
	| +---
	| +--- (base class CChild2)
12	| | {vfptr}
16	| | {vbptr}
20	| | m_iChild2
	| +---
24	| m_iGrandChild
	+---
28	| (vtordisp for vbase CBase)
	+--- (virtual base CBase)
32	| {vfptr}
36	| m_iBase
	+---

　　有了上文的基础，这个派生类的机构就不难理解了。

posted on 2016-05-30 17:30 chen-jiao 阅读(3283) 评论(0) 编辑收藏举报

C++ 中类的内存布局

struct 的内存布局：

Class 的内存布局：

空类

普通类

有虚函数的类

单一继承的类(无虚函数)

单一继承的类（含有虚函数）

多重继承的类（基类都含有虚函数）

菱形结构继承的类（非虚继承）

单一虚继承

多重继承的类（虚继承）

菱形结构继承的类（虚继承）