c++ 多态的内幕

c++ 多态,就是利用了一个二级指针(指针数组),数组里的每个元素都指向了,用virtual修饰的成员函数。

既然提到了指针,那就让我们用内存地址来证明一下吧。

为了证明,我们必须要取到成员函数的首地址。利用下面的函数取得成员函数的地址

template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
    return *static_cast<dst_type*>(static_cast<void*>(&src));
}

调用上面函数的方法:

void* p1 = pointer_cast<void*>(&类名::成员方法名);

1,首先我们先看看非多态的成员方法的内存布局,通过下面的证明代码:

#include "stdio.h"
#include "string.h"
#include <iostream>

template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
    return *static_cast<dst_type*>(static_cast<void*>(&src));
}

class A
{
    private:
        int a;
        char b;
        short c;
    public:
        A(int m,char n,short t)
        {
            a = m;b = n;c = t;
        }
   void funca(){
     std::cout << "A::func()" << std::endl;
   }
};
class B:public A
{
    private:
        char d;
    public:
        B(int m,char n,short t,char q):A(m,n,t)
        {
            d = q;
        }
  void funcb(){
     std::cout << "B::func()" << std::endl;
   }
};

int main()
{
    A x(1,2,3);
    B y(1,2,3,4);

    A* m = new B(1,2,3,4);
    void* p1 = pointer_cast<void*>(&A::funca);
    void* p2 = pointer_cast<void*>(&B::funcb);
    void(*a)() = (void(*)())p1;
    a();
    return 0;
}

实验环境:gcc version 7.3.0。ubuntu18.04

下图是GDB的调试截图

gdb里的操作步骤1,先用【info line 22】命令去得到A类的成员函数funca的地址,22是成员函数funca所在的行号。

gdb里的操作步骤2,因为p1是指向A类的成员函数funca的指针,所以【p p1】的结果就是A类的成员函数funca的地址。

结论:通过步骤1和步骤2的结果来看,得出的两个地址是相同的。

说明了什么呢?说明了非多态的成员函数的地址偏移量,是在编译阶段,就固定好了的。

地址偏移量是啥?

当运行程序时,先从硬盘把程序载入到内存中,这个程序就成为了一个运行中的进程,操作系统会给进程分配虚拟内存空间,为了能够调用到函数,必须知道函数在的虚拟内存空间的地址。这个地址调用侧怎么知道的呢,在编译阶段,编译器自动把被调用函数相对于进程首地址的偏移量算出来了,告诉了调用测,所以调用侧才能找到被调用函数的地址。

2,我们再来看看多态的成员方法的内存布局,通过下面的证明代码:

#include "stdio.h"
#include "string.h"
#include <iostream>

template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
    return *static_cast<dst_type*>(static_cast<void*>(&src));
}

class A
{
    private:
        int a;
        char b;
        short c;
    public:
        A(int m,char n,short t)
        {
            a = m;b = n;c = t;
        }
   virtual void func(){
     std::cout << "A::func()" << std::endl;
   }
   virtual void func1(){
     std::cout << "A::func1()" << std::endl;
   }
};
class B:public A
{
    private:
        char d;
    public:
        B(int m,char n,short t,char q):A(m,n,t)
        {
            d = q;
        }
  virtual void func(){
     std::cout << "B::func()" << std::endl;
   }
   virtual void func1(){
     std::cout << "B::func1()" << std::endl;
   }
};

int main()
{
    A x(1,2,3);
    B y(1,2,3,4);

    A* m = new B(1,2,3,4);
    void* p1 = pointer_cast<void*>(&A::func);
    void* p2 = pointer_cast<void*>(&B::func);
    m->func();//调用的是B的func
    m->func1();//调用的是B的func1
    //void(*a)() = (void(*)())p1;
    //a();
    return 0;
}

下图是GDB的调试截图

指针p1指向的类A的func成员函数;

指针p2指向的类B的func成员函数;

但是从gdb的结果来看,他们指向的地址都是0x1,也就说明他们没有正确的指向类的成员函数。

那么类的成员函数的地址在哪里呢?看下面的gdb截图

通过【p x】查看对象x,发现x里面多了个_vptr的东西。这个东西就是最开始说的二级指针(指针数组)。

步骤1:先用【info line 22】命令去得到A类的成员函数func的地址.

步骤2:【p *(void**)0x555555755d48】,先把_vptr指针转成void型的二级指针,然后再用【*】取得地址里的内容,发现地址类存放的就是类A的成员函数func的地址0x555555554cc4。

结论:_vptr指向的就是所有虚函数中的第一个虚函数的地址。

问题来了,如何得到第二个呢?因为64位系统指针所占8个字节,所以(_vptr + 8)就是第二个虚函数的地址。

下面就让多态的真相浮出水面

当有如下代码:用父类的指针指向子类的对象(多态的最终目的:面对抽象类编程),然后调用子类和父类完全相同的函数(必须是虚函数)。让人迷惑,到底调用的是哪个。

A* m = new B(1,2,3,4);//B是A的子类
m->func();
m->func1();

用父类的指针调用虚函数时,先去它指向的内存中(子类所占用的内存)找_vptr,然后从_vptr里找函数的地址。非虚函数的地址不在_vptr里。

步骤1:【p *m】,发现m是类A的对象

步骤2:【set print object on】,含义是显示对象真正的类型

步骤3:【p *m】,发现m原来不是类A的对象,而是类B的对象。

步骤4:查看_vptr里第一个指针,发现指向的是B的func;加8后得到第二个指针,发现发现指向的是B的func1.

让虚函数们的地址存入_vptr里面的代码肯定是由编译器给我们加上的,这些代码加到哪里了呢?

加到了构造函数里

c/c++ 学习互助QQ群:877684253

本人微信:xiaoshitou5854

posted @ 2019-08-16 17:09  小石王  阅读(504)  评论(0编辑  收藏  举报