Loading

深度探索C++对象模型之第三章:数据语义学


 如下三个类:

class X  { };
class Y :public virtual X { };
class Z : public virtual X {};
class A :public Y,public Z {};

一、编译器优化之前的大小:

上述四个类在优化之前的大小分别是:1、8、8 、12

 类X明明没有任何成员为什么大小是1byte呢?因为那是编译器插入的一个char,这使得这一class的两个object在内存中有独一无二的地址。

 Y和Z的大小都是8,这受到了机器和编译器共同的影响。即以下三个因素:

  • 语言本身造成的负担(overhead)  当C++支持virtual base classes时,就会导致一些额外负担。在derived class中,这个负担会反映成一个指针,它要么指向virtual base class subobject或者指向一个相关table:表格中存放的不是virtual base class subobject的地址,就是其偏移位置。
  • 编译器对特殊情况所提供的优化处理。virtual base class X subobject的1bytes大小也出现在Y和Z上。传统上它们被放在derived class的固定部分的尾端。
  • Alignment的限制(将数值调整到某数的整数倍)

以下是X Y Z A的对象布局:

  

 

来看下类A的大小:一个virtual base class subobject只会在derived class存在一份实例,不管它在class继承体系中出现了多少次:

    • 被大家共享的一个X实例,大小是1byte
    • Base class Y的大小,是4Bytes。Base class Z也是一样。
    • class A自己的大小是:0 bytes
    • alignment 将9bytes调整到12bytes

每个类的大小会增加,由以下两个因素决定:

  • 编译器自动加上额外的data members,用以支持某些语言特性(主要是virtual特性)
  • alignment(边界调整)的需要

二、编译器优化之后的大小:

   对于Empty virtual base class (X ),它没有定义任何数据。某些编译器对它提供了特殊处理,处理之后,empty virtual base class变成了derived class object最开头的一部分(既然有了members,就不需要原本为了empyt安插的一个char).

如果编译器进行优化处理(将empty virtual base class X)的那1byte拿掉,类A只剩下8bytes。

  所以优化后的模型大小分别是:1/4/4/8


 

三、类的data member;

  一个class的data members,可以表现这个class在执行程序时的某种状态。Nonstatic data member放置的是“个别class object”感兴趣的数据,static data members则是放置的整个“class”感兴趣的事情。

  C++将nonstatic data members数据直接放在每一个class object中。对于继承而来的nonstatic data members也是如此,但是并没强制定义其间的排序顺序。而static data member永远只存在一份实例(即使class没有任何object实例),它被存放于程序的一个global data segment中。但是一个template class的static data members行为稍有不同。


四、data member的绑定:  

  我们知道编译器先对整个类的声明进行编译,在进行名字查找时,总是先查找类内的名字,所以当类外和类内使用相同名字的变量时,总是会屏蔽掉类外的那一个,如果我们真的想使用类外的那一个,就使用作用域运算符::。

  但是这种情况对于argument list并不为真, 对于这种情况,应该将nested type声明放置于class的起始处。


五、data member的布局:

 

如上所述的一个类,其Nonstatic data members在class object中的排列顺序将和其声明的顺序一样。任何static data member都不会放入对象布局之中,它们被放在data segment中。members的排列在class object中有较高的地址(C++ Standard)各个members之间并不一定需要连续,比如members的alignment也会填补一些bytes,所以C++标准对数据成员的布局还是相对开放的。

  除了上述members以外,编译器还会合成一些members比如vptr,vptr的位置也是随意,不过最好还是放在开头或结尾部分、 

  另外access sections(public/private/protected)的多寡,不会影响class object的大小和组成(暂时认为是同一个access section的多少:比如private)

 


 

 六、Data的存取

  

1 Point3d origin;
2 Point3d origin , *pt = &origin

 

 

 

  对于static data member,它被视为一个global变量(但是只在class的生命范围之内可见)。classd的存取、关联都不会影响static data member。

并且static data member有且只有一个实例,存放在data segment中。

   比如如下操作:

1 origin.chunkSize = 250;
2 pt->chunkSize =250;

 

  C++通过指针和一个对象来存取member,结论是一样的。其实member并不在class object之中,因此存取static member并不需要class object.即使chunkSize是经过复杂关系继承而来,那也不会影响,static members还是只有一个实例,且存取路径仍然是那么直接。

  若取一个static data member的地址,会得到一个指向其数据类型的指针,而不是一个指向其class member的指针,因为static member并不包含在class object之中。

1 &Point3d::chunkSize;
2 //会得到如下结果:
3 const int*

 

 如果两个class中都声明了static data member,放心啦~编译器会自动对它们进行编码的,咱们不用操心。

 

对于Nonstatic data members,它们直接存放在每个class object中,除非经过explicit或implicit的class object,否则没有办法直接存取它们。只有程序员在member function中直接处理一个nonstatic data member,那么implicit class object就会发生。如下所示:

  

 1 Point3d Point3d::translate(const Point3d*pt){
 2  x+= pt.x;
 3  y+= pt.y;
 4  z+= py.z;
 5 };
 6 
 7 //表面看到的对x/y/z的直接存取,实际上是通过implicit class object (this指针表达)完成的
 8 //成员函数的内部转换如下:
 9 Point3d Point3d::translate(Point3d *const this,const Point3d &pt){
10  this->x += pt.x;
11  this->y += pt.y;
12  this->z += pt.z;
13 
14 };

 

  若是对一个nonstatic data member进行存取操作,则是通过class object的起始地址加上data member的偏移位置(offset).

  

1 origin._y = 0.0;
2 //则地址&origin._y是如下:
3 &origin + (&Point3d::_y - 1);

 

 上述-1操作是指向data member的指针,其offset总是被加上1,用于区分指向data member和class的第一个data member的情况。每个nonstatic data members的偏移位置在编译时期就可以知道。

1 origin._x = 0.0;
2 pt-> _x = 0.0;

 

   上述代码的区别在于当Point3d是一个derived class,且其继承结构中有一个virtual base class,并且被存取的member是从virtual base class继承而来的,那么此时我们就不能说pt具体是指向的哪一种类型,所以我们也就不知道这个offset的真正位置,这个存取操作必须必须延迟到执行时期,经过一个额外的间接导引,才能实现。但是如果使用第一种方式,其类型无疑是Point3d,即使它继承自virtual base class,所以_x的offset在编译时期也就能够确定下来。

 


 

 七、继承的数据成员布局:

   对于derived class和base class的排列顺序,一般编译器总是让base class先出现,但是属于virtual base class的除外。任何一条通则遇到virtual base class都会失效.

 1 class Point2d{
 2 public:
 3 
 4 private:
 5  float x,y;
 6 };
 7 
 8 class Point3d{
 9 public:
10 
11 private:
12  float x,y,z;
13 };

 

 

1.无virtual function的对象布局图:

   

2.单一继承无虚函数:

 

3.单一继承有虚函数:

 当加入虚函数之后,势必会对Point2d class带来空间和存取时间上的额外负担:

  • 导入一个和Point2d有关的virtual table,用于存放每个virtual function的地址。table的元素数 =虚函数个数 + 一个或两个slots(用于RTTI)
  • 在每个class object中,导入一个vptr,用于提供执行期的链接,使每个object都能够找到相应的virtual table.
  • 增强constructor,使它能够为vptr设定初值,让它指向class所对应的virtual table。
  • 增强destructor,使它能够抹消vptr。

 

4.多重继承:

 例如如下多重继承机制:

 

  

 多重继承的问题主要发生在derived class objects和其第二或后继的base class objects之间的转换:对一个多重派生对象,将其地址指定给最左端(第一个)base class的指针,情况和单一继承相同,因为二者具有相同的起始地址。至于第二个或后继的base class则需要,对地址进行修改。

1 Vertex3d v3d;
2 Vertex *pv;
3 Point2d *p2d;
4 Pint3d *p3d;
5 
6 pv = &v3d; //这是将一个派生类赋给第二个base class
7 
8 //则需要这样的内部转换
9 pv = (Vertex*)(((char*)&v3d) + sizeof(Point3d));//要找到v3d显示转换为Vertex大小,然后再加上(Point3d)的地址长度。

4.虚拟继承:

  

  要找到一个办法将istream和ostream各自维护的一个ios subobject,折叠成一个由iostream维护的单一 ios subobject,并且可以保存base class 和derived class的指针(以及reference)之间的多态指定操作。

   方法如下:

  如果类中含有一个或多个virtual base class subobjects,像istream一样,那么这个class将被分割为两部分:一个不变区域和一个共享区域。

  • 不变区域中的数据不管后继如何衍化,总有固定的offset(从object的开头算起),所以这一部分数据可以被直接存取。
  • 共享区域中的数据(virtual base class subobject)其位置会因为每次的派生操作而有所变化,所以它们只能被间接存取。

其中不同编译器之间的差距就在于,间接存取的方式,例如如下继承体系:

 

 

 一般布局策略是先安排好derived class中的派上部分,然后再建立其共享部分。如何存取class的共享部分呢?cfront编译器会在每一个derived class object中安插一些指针,每个指针指向virtual base class。要存取继承得来的virtual base class members,通过相关指针间接完成

  例如如下代码:

  

 1 void Point3d:: operator +=(const Point3d &rhs){
 2  _x += rhs._x;
 3  _y += rhs._y;
 4  _z += rhs._z;
 5 };
 6 
 7 //在cfront的策略之下,运算符会被内部转换为:
 8 
 9 _vbcPoint2d->_x +=rhs._vbcPoint2d->_x; //_vpcPoint2d是那个derived class的指向virtual base class 
10 _vbcPoint2d->_y  +=rhs._vbcPoint2d->_y;
11 _z += rhs._z; 

 

 同时derived class到base class的之间的转换:

1 Point2d *p2d = pv3d;
2 //在c++模型之下变成
3 Point2d *p2d = pv3d ? pv3d->_vbcPoint2d : 0

 

   上述模型缺点:

  • 每个对象必须对其每个virtual base class背负一个额外的指针,导致其负担因virtual base classes的个数而变化。
  • 若虚拟继承串链加长,导致间接存取层次增加,如果我有三层虚拟派生,我就需要三次间接存取(经过三个virtual base class的指针),但是我希望的是有固定的存取时间。

解决第二个问题:由拷贝操作取得所有的nested virtual base class的指针,放到derived class object中,虽然空间上付出了一些代价,但是解决了固定存取时间的问题:如下所示:

  

解决第一个问题:引入所谓的virtual base class table.每个class object如果有一个或多个virtual base classes,就会由编译器安插一个指针,指向virtual base class table,这里面放的是真正的virtual base class 指针。

通常,virtual base class最有效的运用方式是:一个抽象的Virtual base class,没有任何data members.


 

八、对象成员的效率

 1.封装和inline测试:

  • 如果把编译器的优化打开,“封装和inline”就不会带来执行期的效率成本。
  • 如果没有把优化开关打开,就很难猜测到一个程序的效率表现。

  2.继承测试:

  • 单一继承并不会影响效率,因为members被连续存储在derived class object中,并且它的offset在编译时期就已经知道了。这个结果在多重继承下应该也是一样的。
  • 虚拟继承的效率令人失望,间接存取操作压抑了“把所有运算都移往寄存器的优化能力”,但是间接性并不会严重影响非优化程序的执行效率。

 

 九、指向数据成员的指针

  如下述代码:

1 class Point3d{
2 public:
3    virtual ~Point3d();
4 protected:
5     static Point3d origin;
6     float x,y,z;
9 };

 

 static成员放在class object之外,x/y/z按照声明顺序进行排列。vptr不是放在开头就是结尾。

先假设将vptr放在尾端:则x y z在对象布局中offset分别是0 4 8,但是传回的是1 5 9 ?问题在于如何区分一个“没有指向任何data member的指针”和一个指向“第一个data member”的指针:

  考虑如下例子:

float Point3d::*p1 = 0;
float Point3d::*p2 = &Point3d::x;
//Point3d::*的意思是指向“Point3d data member”的指针类型

 

  很明显p1是一个没有指向任何data member的指针,而p2是指向第一个data member的指针。

为了区分p1和p2,每一个真正的data member offset的值都应该被加上1.因此当我们在真正使用该值以指出一个member之前,请先减掉1.

 

接下里看一下,取一个nonstatic data member的地址和取一个绑定到真正class object上的data member的地址,有什么不同?

& Point3d::z;
& origin.z;

 

 

 

第一种将会得到它在class中的offset,即float Point3d::*,而第二行将会得到该member在内存中的真正地址float*。


 

十、指向members的指针的效率问题:

  为每个成员存取操作加上一层间接性,会使得执行时间多出一倍不止。以指向member的指针来存取数据,再一次几乎用掉了双倍时间。而优化使得三种存取策略表现一致。

  由于被继承的data members是直接存放在在class object中的,所以继承的引入并没有影响这些代码的效率。

 

posted @ 2019-08-17 14:44  三只猫-  阅读(367)  评论(0编辑  收藏  举报