Effective C++ 09 绝不在构造和析构过程中调用virtual函数 笔记
本条款开始前我要 先阐述重点:你不该在构造函数和析构函数期间调用virtual函数,因为这样的调用不会带来你预想的结果,就算有你也不会高兴。如果你同时也是一位Java或C#程序员,请更加注意本条,因为这是C++与它们不相同的一个地方。
假设你有个class继承体系,用来塑模股市交易如买进、卖出的订单等等。这样的交易一定要经过审计,所以每当创建一个交易对象,在审计日志(audit log)中也需要创建一笔适当记录。下面是一个看起来颇为合理的做法:
2 public:
3 Transaction();
4 virtual void logTransaction() const = 0; //做出一份因类型不同而不同的日志记录(log entry)
5 ...
6 };
7 Transaction::Transaction() //base class构造函数之实现
8 {
9 ...
10 logTransaction(); //最后动作是志记这笔交易
11 }
12 class BuyTransaction: public Transaction { //derived class
13 public:
14 virtual void logTransaction() const; //志记(log)此型交易
15 ...
16 };
17 class SellTransaction: public Transaction { //derived class
18 public:
19 virtual void logTransaction() const; //志记(log)此型交易
20 ...
21 };
现在,当以下这行被执行,会发生什么事:
无疑地会有一个BuyTransaction构造函数被调用,但首先Transaction构造函数一定会更早被调用;是的,derived class对象内的base class成分会在derived class自身成分被构造之前先构造妥当。Transaction构造函数的最后一行调用virtual函数logTransaction,这正是引发惊奇的起点。这时候被调用的logTransaction是Transaction内的版本,不是BuyTransaction内的版本——即使目前即将建立的对象类型是BuyTransaction。是的,base class构造期间virtual函数绝不会下降到derived classes阶层。取而代之的是,对象的作为就像隶属base类型一样。非正式的说法或许比较传神:在base class构造函数执行期间,virtual函数不是virtual函数。
这一似乎反直觉的行为有个好理由。由于base class构造函数的执行更早于derived class构造函数,当base class构造函数执行时derived class的成员变量尚未初始化。如果此期间调用的virtual函数下降至derived class阶层,要知道derived class的函数几乎必然取用local成员变量,而那些成员变量尚未初始化。这将是一张通往不明确行为和彻夜调试大会串的直达车票。“要求使用对象内部尚未初始化的成分”是危险的代名词,所以C++不让你走这条路。
其实还有比上述理由根本的原因:在derived class对象的base class构造期间,对象的类型是base class而不是derived class。不只virtual函数会被编译器解析至(resolve to)base class,若使用运行期类型信息(runtime type information,例如dynamic_cast(见条款27)和typeid),也会把对象视为base class类型。本例之中,当Transaction构造函数正执行起来打算初始化“BuyTransaction对象内的base class成分”时,该对象的类型是Transaction。那是每一个C++成分(见条款1)的态度,而这样的对待是合理的:这个对象呢你的“BuyTransaction专属成分”尚未初始化,所以面对它们,最安全的做法就是视它们不存在。对象在derived class构造函数开始执行前不会成为一个derived class对象。
相同道理也适用于析构函数。一旦derived class析构函数开始执行,对象内的derived class成员变量便呈现未定义值,所以C++的任何部分包括virtual函数,dynamic_casts等等也就那么看待它。
在上述示例中,Transaction构造函数直接调用一个virtual函数,这很明显而且容易看出违反本条款。由于它很容易被看出来,某些编译器会为此发出一个警告信息(某些则否,见条款53对警告信息的讨论)。即使没有这样的警告,这个问题在执行前也几乎肯定会变得显而易见,因为logTransaction函数在Transaction内是个pure virtual。除非它被定义(不太有希望,但有可能,见条款34)否则程序无法连接,因为连接器找不到必要的Transaction::logTansaction实现代码。
但是侦测“构造函数或析构函数运行期间是否调用virtual函数”并不总是这般轻松。如果Transaction有多个构造函数,每个都需执行某些相同工作,那么避免代码重复的一个优秀做法是把共同的初始化代码(其中包括对logTransaction的调用)放进一个初始化函数init内:
2 public:
3 Transaction( ) //调用non-virtual...
4 { init( ); }
5 virtual void logTransaction() const = 0;
6 ...
7 private:
8 void init()
9 {
10 ...
11 logTransaction(); //这里调用virtual!
12 }
13 };
这段代码概念上和稍早版本相同,但它比较潜藏并且暗中为害,因为它通常不会引发任何编译器和连接器的抱怨。此时由于logTransaction是Transaction内的一个pure virtual函数,当pure virtual函数被调用,大多执行系统会终止程序(通常会对此结果发出一个信息)。然而如果logTransaction是个正常的(也就是impure)virtual函数并在Transaction内带有一份实现代码,该版本就会被调用,而程序也就会兴高采烈地继续向前行,留下你百事不得其解为什么建立一个derived class对象时会调用错误版本的logTransaction。唯一能够避免此问题的做法就是:确定你的构造函数和析构函数都没有(在对象被创建和销毁期间)调用virtual函数,而它们调用的所有函数也都服从同一约束。
但你如何确保每次一有Transaction继承体系上的对象被创建,就会有适当版本的logTransaction被调用呢?很显然,在Transaction构造函数(s)内对着对象调用virtual函数是一个错误做法。
其他方案可以解决这个问题。一种做法是在class Transaction内将logTransaction函数改为non-virtual,然后要求derived class构造函数传递必要信息给Transaction构造函数,而后那个构造函数便可安全地调用non-virtual logTransaction。像这样:
2 public:
3 explicit Transaction(const std::string& logInfo);
4 void logTransaction(const std::string& logInfo) const; //如今是个non-virtual函数
5 ...
6 };
7 Transaction::Transaction(const std::string& logInfo)
8 {
9 ...
10 logTransaction(logInfo);
11 }
12 class BuyTransaction: public Transaction {
13 public:
14 BuyTransaction( parameters ) : Transaction(createLogString( parameters ))//将log信息传给base class构造函数
15 { ... }
16 ...
17 private:
18 static std::string createLogString( parameters );
19 };
换句话说由于你无法使用virtual函数从base class向下调用,在构造期间,你可以借由“令derived class将必要的构造信息向上传递至base class构造函数”替换加以弥补。
请注意本例之BuyTransaction内的private static函数createLogString的运用。是的,比起在成员初值列内给予base class所需数据,利用辅助函数创建一个值传给base class构造函数往往比较方便(也比较可读)。令此函数为static,也就不可能意外指向“初期未成熟之BuyTransaction对象内尚未初始化的成员变量”。这很重要,真是因为“那些成员变量处于未定义状态”,所以“在base class构造和析构期间调用的virtual函数不可下降至derived classes”。
请记住:
在构造和析构期间不要调用virtual函数,因为这类调用从不下降至derived class(比起当前执行构造和析构函数的那层)。