C++中的"pure virtual function call"
前几天我们项目刚刚解决了一个pure virtual function call引起的stopship的bug,乘热打铁,学习总结一下。
理论上的case
当一个纯虚函数被调用到时,vc++的debug模式下会弹出这么一个对话框:
然后就是crash了。
在网上找了一下,发现已经有人对此作了详细的介绍:"Pure Virtual Function Called": An Explanation. 这是一篇相当全面的文章,从纯虚函数抽象基类讲起,介绍了对象模型中vptr及vtable的概念以及他们的构造析构过程。有了这些基础,作者然后列出了5中可能出现"pure virtual function call"的情况,其实可以总结为两种:
- 在基类的构造函数或析构函数中直接或间接的调用纯虚函数
举个在基类构造函数中间接调用纯虚函数的例子:
12345678910111213class
Base
{
public
:
Base(){callVirtual();}
void
callVirtual(){virtualFunc();}
virtual
void
virtualFunc() = 0;
};
class
Derived:
public
Base
{
public
:
virtual
void
virtualFunc(){}
};
Derived d;
//构造过程中调用到纯虚函数
- 通过野指针调用到虚函数
还是上面那个例子,但是不在基类构造函数中调用callVirtual:
1234Derived* pD =
new
Derived;
Base* pB = pD;
delete
pD;
pB->virtualFunc();
其实对于第一种情况,如果你在基类构造函数或析构函数中直接调用纯虚函数,编译器应该能捕捉到这个错误;间接的调用虽然编译器无法检测到,但是由于Scott同学在<Effective C++>中的大力宣传:Item 9: Never call virtual functions during construction or destruction,这种情况发生的概率应该比较小,况且即使发生了,排起错来相对比较简单。
而对于第二种情况,虽然野指针的行为是未定义的,但就我所了解的,我们一般会得到一个"access violation",而不是"pure virutal function call" :
现实中的case
我们在现实中遇到的情况会比上面提到的复杂一些:一个子类对象在析构的过程中遇到异常而未完全销毁,从而遗留下一个"次品"对象,程序继续使用此次品对象而调用到纯虚函数:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | class Base { public : ~Base(){ throw 0;} // . . . a) virtual void virtualFunc() = 0; }; class Derived: public Base { public : virtual void virtualFunc(){} }; Base* pB = new Derived; __try { delete pB; // . . . b) pB = NULL; } __except(EXCEPTION_EXECUTE_HANDLER) { pB->virtualFunc(); // . . . c) } |
在b)处析构Derived对象的时候,在其基类析构函数中a)处抛出了异常,而此时,因为Derived的析构函数已经调用完毕,该对象中的vptr已经指向基类的vtable,从而形成了一个按照正常流程无法构造出来的"次品"对象,当你使用该对象在c)处来调用virtualFunc时,自然导致 "pure virtual function call"的错误。
需要注意的是,这里,你遇到 "pure virtual function call""的时候,可能离真正的出错点,也就是析构函数中抛出异常的点已经很远了。所以这种情况相对来讲比较难调试。
析构函数与异常
好吧,我知道你忍了好久了,你早想喊出来:"你本来就不该在析构函数中抛出异常!",就像Scott同学说的:Item 11: Prevent exceptions from leaving destructors;就像C++ FAQ中说的:Never throw an exception from a destructor.
虽然,也有人站出来说,there is nothing wrong with throwing destructors,但我还是支持你的观点,我们的确不应该在析构函数中抛出异常,不然,我们不得不面对以下两个严重的问题:
- 二次异常导致程序退出;
- 遗留下来的未完全销毁的对象与未完成的工作导致的后续问题
pure virtual function call就是这种情况。
但是理想与现实总是有差距的,有些事情,你总得面对:
- 10多年,几百万行代码,无数人维护过的code base,谁都不敢保证是否某个析构函数会直接或间接的抛出异常。
- 或许我们应该对第1种情况,也就是我们自己的代码负责,对原有代码做一次全面的检查,并保证之后的代码不会在析构函数中抛出异常。可是即使如此,如果我们在析构函数中调用了第三方的库函数,而该函数会抛出异常呢?
- 即使我们调用到的函数( 包括自己的和第三方的)不会显式的抛出异常,当我们用SEH处理异常时,如果代码中出现除0操作,access violation等,都还是会被当做异常捕获的。
- 那么如果在每个non-trivial的析构函数中都加上异常处理呢?这样代码未免也太ugly了。况且在保证不主动抛出异常的前提下,这样的代码只是以防万一,意义不是很大。
所以,要在析构函数中完全避免异常还是蛮纠结的。Herb Sutter曾就C++语言提出过一个提议:让析构函数无法抛出异常,从语言级别上去解决,但被Bjarne Stroustrup, Andy Koenig等人否决了。因为这会导致原有程序的行为不一致,况且在极少数的情况下,我们还是希望能抛出异常来的。
这里我的结论就是:不主动,不拒绝。不主动是指原则上杜绝在析构函数中抛出异常;不拒绝是指不强制在析构函数中去swallow莫须有的异常,而是把可能的问题暴露出来才便于解决。比如上面提到的那个现实中的例子,通过抛出异常,然后调用pure virtual function call把问题暴露出来,我们就可以着手研究为什么会抛出异常,如何处理不让其抛出异常~~~
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述