C++中多态的实现原理

多态是面向对象的基本特征之一。而虚函数是实现多态的方法。那么virtual function到底如何实现多态的呢?

1 基类的内存分布情况
请看下面的sample

class A
{
void g(){.....}
};
则sizeof(A)=1;
如果改为如下:
class A
{
public:
    virtual void f()
    {
       ......
    }
    void g(){.....}
}
则sizeof(A)=4! 这是因为在类A中存在virtual function,为了实现多态,每个含有virtual function的类中都隐式包含着一个静态虚指针vfptr指向该类的静态虚表vtable, vtable中的表项指向类中的每个virtual function的入口地址
例如 我们declare 一个A类型的object :
    A c;
    A d;
则编译后其内存分布如下:

从vfptr所指向的vtable可以看出,每个virtual function都占有一个entry,例如本例中的f函数。而g函数因为不是virtual类型,故不在vtable的表项之内。说明:vtab属于类成员静态pointer,而vfptr属于对象pointer
2 继承类的内存分布状况
假设代码如下:
public B:public A
{
public :
    int f() //override virtual function
    {
        return 3;
    }
};


A c;
A d;
B e;
编译后,其内存分布如下:


从中我们可以看出,B类型的对象e有一个vfptr指向vtable address:0x00400030 ,而A类型的对象c和d共同指向类的vtable address:0x00400050a

3 动态绑定过程的实现
    我们说多态是在程序进行动态绑定得以实现的,而不是编译时就确定对象的调用方法的静态绑定。
    其过程如下:
    程序运行到动态绑定时,通过基类的指针所指向的对象类型,通过vfptr找到其所指向的vtable,然后调用其相应的方法,即可实现多态。
例如:
A c;
B e;
A *pc=&e; //设置breakpoint,运行到此处
 pc=&c;
此时内存中各指针状况如下:

可以看出,此时pc指向类B的虚表地址,从而调用对象e的方法。

继续运行,当运行至pc=&c时候,此时pc的vptr值为0x00420050,即指向类A的vtable地址,从而调用c的方法。
这就是动态绑定!(dynamic binding)或者叫做迟后联编(lazy compile)。

 

为了更加透析多态的原理,我们可以debug 程序在runtime时候的对象内存分布情况。

以下面这段简单的程序为例

// SimpleStack.cpp : Defines the entry point for the console application.
//

#include 
"stdafx.h"

class Base
{
public:
    
int m_data;
    
static int m_staticvalue;
    Base(
int data)
    {
        m_data
=data;
    }
    
virtual void DoWork()
    {
    }
};

class AnotherBase
{
public:
    
virtual void AnotherWork()
    {}
    
};

class DerivedClass:public Base,public AnotherBase
{
public:
    DerivedClass(
int t_data):Base(t_data)
    {}

    
virtual    void  DoWork()
    {
    }

    
virtual void AnotherWork()
    {
    }
};

int Base::m_staticvalue=1;

int main(int argc, char* argv[])
{
    
    DerivedClass b(
1);
    b.DoWork();

    
return 0;
}

 

当程序运行后我们设置很简单的breakpoint: bp simplestack!derivedclass::dowork. 断点命中后的call stack如下:

0:000> kb
ChildEBP RetAddr  Args to Child             
0012ff20 0040102a 00daf6f2 00daf770 7ffd7000 SimpleStack!DerivedClass::DoWork
0012ff80 004012f9 00000001 00420e80 00420dc0 SimpleStack!main+0x2a
0012ffc0 7c817077 00daf6f2 00daf770 7ffd7000 SimpleStack!mainCRTStartup+0xe9
0012fff0 00000000 00401210 00000000 78746341 kernel32!BaseProcessStart+0x23


这时,我们可以看看DerivedClass对象的内存内分布情况:

0:000> dt SimpleStack!DerivedClass 0012ff74
   +0x000 __VFN_table : 0x0040c020  //指向虚表的指针1
   +0x004 m_data           : 1
   =0040d030 Base::m_staticvalue : 1  //(类成员)
   +0x008 __VFN_table : 0x0040c01c  //指向虚表的指针2

可以看到,DerivedClass对象中包含两个指向虚表的指针,地址分别为0x0040c020 和0x0040c01c 。一个为指向override了BaseClass的方法的虚表,一个指向orverride了AnotherBase方法的虚表。

可以查看对应虚表中的方法:

0:000> dds 0x0040c01c
0040c01c  00401140 SimpleStack!DerivedClass::AnotherWork
0040c020  00401110 SimpleStack!DerivedClass::DoWork
0040c024  004010e0 SimpleStack!Base::DoWork
0040c028  004011a0 SimpleStack!AnotherBase::AnotherWork
......

通过以上分析,应该可以透析多态的本质了。

posted on 2008-06-30 16:27  飞天舞者  阅读(3361)  评论(8编辑  收藏  举报

导航

For more information about me, feel free email to me winston.he@hotmail.com