c++ 多态的内幕
c++ 多态,就是利用了一个二级指针(指针数组),数组里的每个元素都指向了,用virtual修饰的成员函数。
既然提到了指针,那就让我们用内存地址来证明一下吧。
为了证明,我们必须要取到成员函数的首地址。利用下面的函数取得成员函数的地址
template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
return *static_cast<dst_type*>(static_cast<void*>(&src));
}
调用上面函数的方法:
void* p1 = pointer_cast<void*>(&类名::成员方法名);
1,首先我们先看看非多态的成员方法的内存布局,通过下面的证明代码:
#include "stdio.h"
#include "string.h"
#include <iostream>
template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
return *static_cast<dst_type*>(static_cast<void*>(&src));
}
class A
{
private:
int a;
char b;
short c;
public:
A(int m,char n,short t)
{
a = m;b = n;c = t;
}
void funca(){
std::cout << "A::func()" << std::endl;
}
};
class B:public A
{
private:
char d;
public:
B(int m,char n,short t,char q):A(m,n,t)
{
d = q;
}
void funcb(){
std::cout << "B::func()" << std::endl;
}
};
int main()
{
A x(1,2,3);
B y(1,2,3,4);
A* m = new B(1,2,3,4);
void* p1 = pointer_cast<void*>(&A::funca);
void* p2 = pointer_cast<void*>(&B::funcb);
void(*a)() = (void(*)())p1;
a();
return 0;
}
实验环境:gcc version 7.3.0。ubuntu18.04
下图是GDB的调试截图
gdb里的操作步骤1,先用【info line 22】命令去得到A类的成员函数funca的地址,22是成员函数funca所在的行号。
gdb里的操作步骤2,因为p1是指向A类的成员函数funca的指针,所以【p p1】的结果就是A类的成员函数funca的地址。
结论:通过步骤1和步骤2的结果来看,得出的两个地址是相同的。
说明了什么呢?说明了非多态的成员函数的地址偏移量,是在编译阶段,就固定好了的。
地址偏移量是啥?
当运行程序时,先从硬盘把程序载入到内存中,这个程序就成为了一个运行中的进程,操作系统会给进程分配虚拟内存空间,为了能够调用到函数,必须知道函数在的虚拟内存空间的地址。这个地址调用侧怎么知道的呢,在编译阶段,编译器自动把被调用函数相对于进程首地址的偏移量算出来了,告诉了调用测,所以调用侧才能找到被调用函数的地址。
2,我们再来看看多态的成员方法的内存布局,通过下面的证明代码:
#include "stdio.h"
#include "string.h"
#include <iostream>
template<typename dst_type,typename src_type>
dst_type pointer_cast(src_type src)
{
return *static_cast<dst_type*>(static_cast<void*>(&src));
}
class A
{
private:
int a;
char b;
short c;
public:
A(int m,char n,short t)
{
a = m;b = n;c = t;
}
virtual void func(){
std::cout << "A::func()" << std::endl;
}
virtual void func1(){
std::cout << "A::func1()" << std::endl;
}
};
class B:public A
{
private:
char d;
public:
B(int m,char n,short t,char q):A(m,n,t)
{
d = q;
}
virtual void func(){
std::cout << "B::func()" << std::endl;
}
virtual void func1(){
std::cout << "B::func1()" << std::endl;
}
};
int main()
{
A x(1,2,3);
B y(1,2,3,4);
A* m = new B(1,2,3,4);
void* p1 = pointer_cast<void*>(&A::func);
void* p2 = pointer_cast<void*>(&B::func);
m->func();//调用的是B的func
m->func1();//调用的是B的func1
//void(*a)() = (void(*)())p1;
//a();
return 0;
}
下图是GDB的调试截图
指针p1指向的类A的func成员函数;
指针p2指向的类B的func成员函数;
但是从gdb的结果来看,他们指向的地址都是0x1,也就说明他们没有正确的指向类的成员函数。
那么类的成员函数的地址在哪里呢?看下面的gdb截图
通过【p x】查看对象x,发现x里面多了个_vptr的东西。这个东西就是最开始说的二级指针(指针数组)。
步骤1:先用【info line 22】命令去得到A类的成员函数func的地址.
步骤2:【p *(void**)0x555555755d48】,先把_vptr指针转成void型的二级指针,然后再用【*】取得地址里的内容,发现地址类存放的就是类A的成员函数func的地址0x555555554cc4。
结论:_vptr指向的就是所有虚函数中的第一个虚函数的地址。
问题来了,如何得到第二个呢?因为64位系统指针所占8个字节,所以(_vptr + 8)就是第二个虚函数的地址。
下面就让多态的真相浮出水面
当有如下代码:用父类的指针指向子类的对象(多态的最终目的:面对抽象类编程),然后调用子类和父类完全相同的函数(必须是虚函数)。让人迷惑,到底调用的是哪个。
A* m = new B(1,2,3,4);//B是A的子类
m->func();
m->func1();
用父类的指针调用虚函数时,先去它指向的内存中(子类所占用的内存)找_vptr,然后从_vptr里找函数的地址。非虚函数的地址不在_vptr里。
步骤1:【p *m】,发现m是类A的对象
步骤2:【set print object on】,含义是显示对象真正的类型
步骤3:【p *m】,发现m原来不是类A的对象,而是类B的对象。
步骤4:查看_vptr里第一个指针,发现指向的是B的func;加8后得到第二个指针,发现发现指向的是B的func1.