浅谈C++虚函数

　　很长时间都没写过博客了，主要是还没有养成思考总结的习惯，今天来一发。

　　我是重度拖延症患者，本来这篇总结应该是早就应该写下来的。

一、虚函数表

　　C++虚函数的机制想必大家都清楚了。不清楚的同学请参看各种C++入门书籍。这里，我要讨论一下这个虚函数机制究竟是怎么实现的。虚函数主要是靠一张VTABLE来实现的，先来看看这个VTABLE在哪里。

　　首先我们看下面的代码：

 1 class ClassA
 2 {
 3 public:
 4     int m_data1;
 5     int m_data2;
 6     void vfunc1(){cout << "i am A" << endl;}
 7 };
 8 class ClassB : public ClassA
 9 {
10 public:
11     int m_data3;
12     void funcB(){}
13     void vfunc1(){cout << "i am B" << endl;}
14 };
15 class ClassC : public ClassB
16 {
17 public:
18     int m_data1;
19     int m_data4;
20     void funcC(){}
21     void vfunc1(){cout << "i am C" << endl;}
22 };
23 int main()
24 {
25     ClassA a;
26     ClassB b;
27     ClassC c;
28     cout << sizeof(int) << endl;
29     cout << sizeof(ClassA) << endl;
30     cout << sizeof(ClassB) << endl;
31     cout << sizeof(ClassC) << endl;
32 
33     cout << &(a) << endl;
34     cout << &(a.m_data1) <<endl;
35     cout << &(a.m_data2) <<endl;
36     cout << endl;
37 
38     cout << &(b) << endl;
39     cout << &(b.ClassA::m_data1) << endl;
40     cout << &(b.ClassA::m_data2) << endl;
41     cout << &(b.m_data3) <<endl;
42     cout << endl;
43 
44     cout << &(c) << endl;
45     cout << &(c.ClassA::m_data1) << endl;
46     cout << &(c.m_data2) << endl;
47     cout << &(c.m_data3) << endl;
48     cout << &(c.m_data1) <<endl;
49     cout << &(c.m_data4) <<endl;
50     
51     return 0;
52 }

　　我如果把上面的程序中ClassA的函数vfunc1声明成虚函数，即将第6行改为：

1 virtual void vfunc1(){cout << "i am A" << endl;}

　　程序运行的两个结果分别为：

　　由上面的结果可以明显的看出，声明为虚函数的类比原来的类在大小上多了4个字节。没有虚函数的类的起始地址和第一个成员变量的地址保持一致，有虚函数的类的起始地址在第一个成员变量地址的前四个字节。这中间多出来的这四个字节就是隐藏起来的VPTR。VPTR是一个指向一个VTABLE的指针，换句话说，这多出来的四个字节里面存的是VTABLE的地址。

　　而VTABLE里面就记录了这个类里面虚函数的地址。

再看下面的代码：

1  ClassA *pa;
2  ClassB *pb;
3  ClassC *pc;
4  pa = &c;
5  pa->vfunc1();

　　我们都知道如果是虚函数，上面的代码结果肯定为

　　i am C

　　如果没用虚函数，结果为

　　i am A

　　这是怎么做到的？

　　首先，我们要知道，子类继承父类，子类拥有所有父类的成员变量跟成员函数，就是说：

1 c.vfunc1();
2 c.ClassA::vfunc1()

　　我们可以上面的方式显示地去访问被子类覆盖掉的函数和变量。可以理解为，虽然名字一样，其实子类里面有两个独立的vfunc1()函数，只不过子类调用的默认为ClassC::vfunc1()函数。

　　当我们用父类的指针去指向一个子类的指针时，会有一个向上转换（我暂时这么叫）的过程。用pa指向对象c时，pa是一个ClassA类型的指针,pa只能访问ClassA类里面有的成员变量和成员函数地址，多余的，A类没有而C类有的成员变量和函数地址都被“upcasting”掉了。

　　没有VTABLE时，只能找到ClassA类的vfunc1()函数的地址，找不到ClassC类的vfunc1()函数的地址。有虚函数表的存在时，对象c的虚函数表里面会记录ClassC::vfunc1()的地址，这样用pa指向对象c时，虚函数表不会被“upcasting”掉，于是，按照虚函数表里面的地址，就能够成功访问ClassC::vfunc1()。

　　简言之，就是虚函数表里面存有正确的函数地址，这样就实现了动态绑定。用一张图来表示就是：

（如果有多个虚函数，VTABLE里面就有多个地址）

二、切片

　　首先我们在三个类里面分别添加三个函数：

1 virtual void funcSlicing(){cout << "slicing A" << endl;}
2 virtual void funcSlicing(){cout << "slicing B" << endl;}
3 virtual void funcSlicing(){cout << "slicing C" << endl;}

　　再看如下的代码：

1 ClassA *pa = &c;
2 pa->funcSlicing();
3 c.funcSlicing();
4 ((ClassA*)(&c))->funcSlicing();
5 ((ClassA)c).funcSlicing();

　　如果你能一眼看出上面程序的运行结果，那接下来你就可以不用再看了。正确的结果是：

　　前面三个应该很好理解，就是前面的虚函数机制。最后一句((ClassA)c).funcSlicing()的结果为什么是“slicing A”呢。这就是传说中的对象切片了。(ClassA)c这个操作意味着什么？这个操作意味着调用ClassA::默认拷贝构造函数将对象c中继承自ClassA类的成员进行copy，这个过程包含把对象c的VPTR(原来指向ClassC::VTABLE)修改为指向ClassA::VTABLE，而对象c中多余的东西则被“切割”掉了。

　　这个时候(ClassA)c已经完完全全是一个ClassA了，这就是对象切片。

　　也就是说，假如我有如下的一个函数：

1 void TEST(ClassA a)
2 {
3     a.funcSlicing();
4 }

　　这个时候，无论我调用TEST(b)或者TEST(c)，结果都应该是调用ClassA::funcSlicing()，因为发生了对象切片。

　　在多态的机制里面，我们总是应该是传对象的地址或者引用，不应该以对象本身作为参数传递。

　　这里，我再简单说一下纯虚函数，我们都知道有纯虚函数的抽象类是不能实例化的。为什么不能实例化？因为纯虚函数强制性的给VTABLE里面留了一个空位置，这个位置里面没有留任何函数地址，为空。而我们在创建一个包含虚函数的对象时，编译器首先要做的事情就是初始化VPTR和VTABLE。只要有一个纯虚函数存在，那么VTABLE就是不完整的，为这样的类（抽象类）创建对象，编译器会返回错误信息。

　　同理，在上面的例子中，假如我们把ClassA::funcSlicing()改为纯虚函数：

1 virtual void funcSlicing() = 0;

　　TEST()函数就会编译错误，纯虚函数重要作用之一就是防止对象切片的发生。

　　PS：C++果然是超级复杂，要兼顾效率和设计，完全取决于使用者的需要。我也只能是，用到哪里就好好把哪部分学一下。

　　2014-1-11更新：

　　偶然间看到一篇大牛的文章，C++ 虚函数表解析，又深刻体会到自己与别人的差距，你对一个东西理解有多深，你就可以给别人讲多清楚。由这篇文章的启发，可以用函数指针来访问虚函数表里面的函数。

　　首先，声明这样一个函数指针的类型：

1 typedef void(*Fun)(void);

　　然后用下面的代码去访问虚函数表里面的函数（在陈的那篇文章第一个例子里面会有一些细节错误）：

 1  Fun pFun = NULL;
 2  pFun = (Fun)*((int *)*((int *)&c + 0)+0);
 3  pFun();
 4  pFun = (Fun)*((int *)*((int *)&c + 0)+1);
 5  pFun();
 6  //虚函数表(VPTR)的地址(对象c起始四字节里面的内容)：*((int *)&c + 0)
 7  //(int *)的作用是强制转换成四字节的int型指针，这样指针偏移是以四字节为单位。
 8  //虚函数表里面第一个虚函数地址 *((int *)*((int *)&c + 0)+0)
 9 
10  int **pVtable = (int **)&c;//这样就直观多了，两次寻址。
11  pFun = (Fun)pVtable[0][0];
12  pFun();

　　我想，聪明的你肯定清楚上面代码的执行结果。这样，就不是空口无凭了。

posted @ 2014-01-10 00:17 细胞核阅读(1103) 评论(5) 编辑收藏举报

刷新页面返回顶部

细胞核

奇怪的生物

浅谈C++虚函数

公告