C++虚函数机制(转)
C++的虚函数(Virtual Function)是通过一张虚函数表(Virtual Table)来实现的。简称为V-Table。 在这个表中,主是要一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其容真实反应实际的函数。这样,在有虚函数的类的实例中这个表被分配在了 这个实例的内存中,所以,当我们用父类的指针来操作一个子类的时候,这张虚函数表就显得由为重要了,它就像一个地图一样,指明了实际所应该调用的函数。
1. 无继承的情况
|
注意:在上面这个图中,虚函数表中最后一个节点相当于字符串的结束符,其标志了虚函数表的结束,在Codeblocks下打印为0。
2. 继承,无虚函数覆盖的情形
|
从上表可以发现:
1. 虚函数按照其声明顺序放于表中。
2. 父类的虚函数在子类的虚函数前面。
3. 继承,虚函数覆盖的情形
|
从上表可以看出:
1. 覆盖的f()函数被放到了虚表中原来父类虚函数的位置。
2. 没有被覆盖的函数依旧。
3. 可通过获取获取成员函数指针来调用成员函数(即使是private类型的),带 来一定安全性的影响。
4. 多继承的情形
|
从上表可以看出:
1. 每个父类都有自己的虚表。
2. 子类的成员函数被放到了第一个父类的表中。(所谓的第一个父类是按照声明顺序来判断的)
3. 对于多继承无虚函数覆盖的情况,布局与上图类似(Derive的位置对应Base)。
××楼主回答面试官说“跟cpu流水线执行效率有关”
××某人回答“因为虚函数需要一次间接的寻址... 而一般的函数可以在编译时定位到函数的地址,虚函数(动态类型调用)是要根据某个指针定位到函数的地址. ”
×ד虚函数有个虚函数表,而且会传一个index索引~!会间接寻址!”
×ד流水线执行的话,和"命中率"有关吧. 也就是说在流水线后端,已经译码成功的,和正在执行的代码的后继是一样的. 否则流水线会中断,也就是说在后端做的是无效的,需要重新译码.”
搞笑的是以下人的回复:
×ד的确,计算机程序效率说到底和计算机指令流水线息息相关(还和缓存命中率有关)。但是,把虚函数效率低的原因解释到流水线这一层,是极其变态的,这个考官很可能是在卖弄自己的水平而已。”
×ד楼主以后你要是遇到这种考官,你和他谈与非逻辑门,硅锗原子的组成和爱因斯坦相对论对虚函数的影响,绝对震惊四座!”
×ד说是因为流水线执行的原因,根本与问题不着边际。或者应该说影响流水线执行是效率低的无数原因中的一种才好。”
×ד首先是由this指向查找虚函数表,然后找到相应的虚函数地址
比非虚函数多查找一次
如果是(多继承)基类指针指向派生类对象的话,有可能会涉及this指针的调整
比如先访问基类的成员数据再访问派生类的析构函数 就要进行一次this指针的调整
具体可以参见 insied the c++ object model的多重继承下的virtual functions ”
×ד一些C++的书籍有明确的说明,针对类的虚函数的机制,如果有虚函数的话,编译器会为类增加一个虚函数表(VBL),当在动态执行程序时,会到该虚函数表中寻找函数。多增加了一个过程,效率肯定会低一些,但带来了运行时的多态。”
×ד流水线 貌似说的是 CPU执行代码的提前取指令吧
虚函数 效率低 是因为 执行过程中会跳转两次(首先找到对象的函数表,其次通过该函数表中存的虚函数表地址找到真正的执行地址),这样CPU运行的时候会跳转两次,而普通函数只跳一次。CPU每跳转一次,预取指令基本上就要作废很多,所以效率会很低。”
/////////////////////////////////////最后得分者
和流水线相关是说得通的,究其原因还是因为存在动态跳转,这会导致分支预测失败,流水线排空。
设想一下,如果说不是虚函数,那么在编译时期,其相对地址是确定的,编译器可以直接生成jmp/invoke指令;
如果是虚函数,多出来的一次查找vtable所带来的开销,倒是次要的,关键在于,这个函数地址是动态的,譬如
取到的地址在eax里,则在call eax之后的那些已经被预取进入流水线的所有指令都将失效。流水线越长,一次分支预测失败的代价也就越大。
pf->test();
011E146D mov eax,dword ptr [pf]
011E1470 mov edx,dword ptr [eax]
011E1472 mov esi,esp
011E1474 mov ecx,dword ptr [pf]
011E1477 mov eax,dword ptr [edx]
011E1479 call eax <------------------------- 分支预测失效
011E147B cmp esi,esp
011E147D call @ILT+355(__RTC_CheckEsp) (11E1168h)
此兄接着回答道“说到流水线,penalty基本上都是因为气泡(也就是分支指令造成预取失效),知道这个以后碰到了就不会再卡壳了。虽然引入流水线(流水线其实是 RISC最初使用的),极大提高了效率,流水线不是越长越好。像P4,几十级流水线,频率虽高,但是性能不好,很大原因就是因为流水线实在臭长。有兴趣可 以去看看CPU怎么做分支预测,乱序执行的。”
//////////////////////////////////
还是贴上原帖的地址吧 http://topic.csdn.net/u/20081031/12/06d0e218-8aab-4203-850c-9e6b76099c09.html
由此还引申出一个问题 虚函数在编译器里是怎么工作的
一般来说,对于开发者我们只需要知道虚函数的使用方法,以及虚函数表的存在即可。但面试时往往会遇到更细节的问题,比如让你实现一个虚函数机制,虽然不太实用,总归了解些底层知识也是件好事。但如果有人苦苦相逼一定要拿这个刷人,你就去骂他吧,你才是写编译器的,你们全家都是写编译器的。唉,我有些失态了...
1. 虚函数与虚函数表基本知识 这里有一篇介绍,只需看前两页,各种配图,很形象:http://dev.yesky.com/208/8061708.shtml 这篇文章则更精练,只需看第一段就好:http://blog.csdn.net/jiangnanyouzi/article/details/3720807 总的来说,每一个拥有virtual function的类实例化对象时,都会额外申请一块内存存储虚函数表存储所有虚函数地址,并在对象某个位置存储一个vptr指针指向该表起始地址。这个指针具体放在什么位置,虚函数表怎么组织,怎么索引各个虚函数,这些都是编译器在编译期间决定的,在不同编译环境下不见得相同。
2. 多态子类的调用顺序 -- 为什么不要在构造函数中调用虚函数 原因是,在子类的构造函数执行时,虚函数表还没有被子类覆盖,换句话说,此时调用的函数是当前类的函数,虚函数机制在构造函数中无法触发。其原因在于子类构造时各个初始化步骤的调用顺序: 全部推演过程见此:http://saturnman.blog.163.com/blog/static/557611201081421344244/ 直接摘录构造顺序: 1.构造子类构造函数的参数 2.子类调用基类构造函数 3.基类设置vptr 4.基类初始化列表内容进行构造 5.基类函数体调用 6.子类设置vptr 7.子类初始化列表内容进行构造 8.子类构造函数体调用 (注意一点,初始化列表内的数据不按书写顺序,而是按类内部的定义顺序) 析构的顺序恰好相反,所以也不要在析构函数中调用虚函数,那样也是没有意义的。
3. 如何去验证虚函数表的存在 其实在第一个链接里已经有了示例程序。 如果你看不懂函数指针,请看这里:http://hi.baidu.com/homonia/blog/item/90b7a72c49c521ea8a1399e2.html
4. 为什么构造函数不能是虚函数 从设计理念上说,构造函数不需要是虚函数;从当前vptr的实现机制上说,无法实现虚的构造函数。 详细可见这里:http://www.diybl.com/course/3_program/c++/cppxl/2008320/105849.html 原文:http://hi.baidu.com/hehehehello/blog/item/6f0d2f3443bb26205bb5f507.html
|