虚函数表里边保存的不一定是虚函数的地址
我一直以为虚函数表里边保存的就是虚函数的地址,前几天做测试的时候才发现这想法不一定是对的。
测试代码:
//虚函数表里边保存的不一定是虚函数的地址.cpp //2010.8.19 /*分析:通过最后的输出结果可以发现,通过Derived类的虚函数表调用所有的虚函数, 发现第一张虚函数表的输出①和第二张虚函数表的输出④它们是同一个函数的输出, 在虚函数表项上的值却是不同的。 如果虚函数表上的项的值都是虚函数的地址,那么Derived的两张表里边用于调用show()函数的表项的值应该是相同的,但事实上它们不同。 这说明,虚函数表里边保存的未必就是虚函数的地址。 这种情况在之前一直没有遇到过(或者没注意到),那么那两个不同的值哪一个才是Derived::show()函数的地址呢? 反汇编分析。。 //Code::Blocks VS2005/2008 */ #include <iostream> using namespace std; class BaseA { public: virtual void show() { cout << "BaseA::show()" << endl; } virtual void showAA() { cout << "BaseA::showAA()" << endl; } }; class BaseB { public: virtual void show() { cout << "BaseB::show()" << endl; } virtual void showBB() { cout << "BaseB::showBB()" << endl; } }; class Derived : public BaseA, public BaseB { public: /*重写*/ void show() { cout << "Derived::show()" << endl; } virtual void showD() { cout << "Derived::showD()" << endl; } }; int main() { typedef void (__thiscall *Fun)(void*pThis);//非常重要 BaseA aobj; BaseB bobj; Derived dobj; /*BaseA对象*/ int** p = (int**)&aobj; cout << "-----BaseA类的对象-----" << endl; cout << "①BaseA:\t" << (int*)p[0][0] << "\t"; ((Fun)p[0][0])(p); cout << "②BaseA:\t" << (int*)p[0][1] << "\t"; ((Fun)p[0][1])(p); cout << endl; /*BaseB对象*/ p = (int**)&bobj; cout << "-----BaseB类的对象-----" << endl; cout << "①BaseB:\t" << (int*)p[0][0] << "\t"; ((Fun)p[0][0])(p); cout << "②BaseB:\t" << (int*)p[0][1] << "\t"; ((Fun)p[0][1])(p); cout << endl; /*Derived对象的第一个虚函数表指针所指向的虚函数表*/ p = (int**)&dobj; cout << "-----Derived类的对象-----" << endl; cout << "①Derived:\t" << (int*)p[0][0] << "\t"; ((Fun)p[0][0])(p); cout << "②Derived:\t" << (int*)p[0][1] << "\t"; ((Fun)p[0][1])(p); cout << "③Derived:\t" << (int*)p[0][2] << "\t"; ((Fun)p[0][2])(p); cout << endl; /*Derived对象的第二个虚函数表指针所指向的虚函数表*/ p = (int**)((int*)(&dobj)+1); cout << "④Derived:\t" << (int*)p[0][0] << "\t"; ((Fun)p[0][0])(p); cout << "⑤Derived:\t" << (int*)p[0][1] << "\t"; ((Fun)p[0][1])(p); system("pause"); return 0; } /* -----BaseA类的对象----- ①BaseA: 00401320 BaseA::show() ②BaseA: 00401350 BaseA::showAA() -----BaseB类的对象----- ①BaseB: 004013A0 BaseB::show() ②BaseB: 004013D0 BaseB::showBB() -----Derived类的对象----- ①Derived: 00401440 Derived::show() ②Derived: 00401350 BaseA::showAA() ③Derived: 00401470 Derived::showD() ④Derived: 00405430 Derived::show() ⑤Derived: 004013D0 BaseB::showBB() */
分析
一、反汇编分析
通过测试结果可以发现虚函数表里边保存的可能并非虚函数的地址,但是肯定跟虚函数有一点关联,因为最后通过虚函数表里的表项成功的调用了虚函数。通过反汇编分析,结果表明Derived类的第二张虚函数表里边保存的跟Derived::show()函数相关的表项,并非该函数的地址。分析过程如下:
1、 第一张虚函数表跟Derived::show()函数相关的表项保存的是该函数的地址。
图 1 通过第一张虚函数表调用show()函数
CALL EDX 按F7跟进之后见下图:
图 2 Derived::show()函数
2、 第二张虚函数表跟Derived::show()函数相关的表项保存的不是该函数的地址
图 3通过第二张虚函数表调用show()函数
CALL EDX 按F7跟进之后见下图:
图 4 跳转
可以发现,跳转的目标地址正是Derived::show()函数。
3、 总结:第一张虚函数表里边保存了Derived::show()函数的地址。第二张虚函数表里边保存的不是Derived::show()虚函数的地址,但是跟该虚函数地址间接关联了。
二、不直接保存函数地址的原因
现在已经明白,虚函数表里边保存的是什么东西了。还有另外一个问题,为什么第二张虚函数表里边不保存Derived::show()函数的地址,偏偏要保存跳转的地址,然后再跳过去,这样子有什么用途?
这个跟类的成员函数调用会传递this指针有关。
假如有这样的语句:
BaseB* pb = &dobj;
Pb->show();
如果没有中间的跳转,直接就去调用show()函数,那么传递的this指针是Derived对象中BaseB类实例的地址,也就是第二张虚函数表地址。这样的话,如果要访问dobj中的成员变量,通过这个this指针访问就会出错。可能Derived::show()会认为传递进来的是Derived对象的BaseA实例的地址。所以就需要图4中的代码,第二张虚函数表的表项保存的是那个sub的地址。在跳转之前先ecx减去4,在例子中可以发现,减去4使得this指针指向了dobj的地址(就是BaseA实例的地址)。
也就是说,之所以第二张虚函数表里边保存的不是函数地址,是为了保证this指针是正确。
原因猜测:可以通过A类指针去调用D::show(),也可以通过B类指针去调用D::show(),如果this指针不加调整,D::show()要访问成员变量的时候是this+偏移值来寻址的,这样就会有错误。所以必须调整。
三、这种情况什么时候出现
另一个问题, 什么时候虚函数表里边保存的不是函数地址?
如果要全面测试的话,那实在是件费力的事,所以猜测可能是这种情况:
派生类D有两个基类A和B,其中A定义了虚函数show(),B也定义了虚函数show(),且D类重写了虚函数show(),这样的D类中的第二张虚函数表(B类实例)里边保存的表项就不是D::show()虚函数地址。
也就是说通过B类指针调用D类对象的show()函数时,需要调整this指针。
PS:以上分析以VS2005/2008为编译器,不过,结论对GCC编译器也适应。
学习参考:http://topic.csdn.net/u/20091128/14/5a9ff412-560e-4214-8716-e269295f7028.html
2010.8.20
-----------------
注:本文是在不考虑跳转表的情况下分析的。--2010.9.5