Program Transformation Semantics (程序转换语义学)
本文是Inside The C++ Object Model Chapter 2 部分的读书笔记。讨论编译器调用拷贝构造函数时的策略(如何优化以提高效率),侯捷称之为"程序转化的语义学"
或者说是关于编译器对于程序是如何进行有效转化或者说翻译,以实现C++的语法机制。主要来说有以下几种Semantics:
1) 明确的初始化操作(Explicit Initialization)
比如定义: X x0;
那么以下定义: X x1(x0); X x2 = x0; X x3 = X(x0); 都会被转化成: X x1,x2,x3; 在这里编译器并不会做这三个object的初始化,而是调用copy constructor进行初始化:
x1.X::X(x0); x2.X::X(x0); x3.X::X(x0);
2) 参数初始化(Argument Initialization)
C++ Standard ( Section 8.5)说,把一个class object 当做参数传递给一个函数或者把它作为一个函数的返回值时,相当于以下形式的初始化操作:
X xx = arg;其中xx是形式参数或者返回值,arg代表真正的参数值,因此类似于void foo(X x0);这种调用,将会使得local instance x0以memberwise的形式以实际参数为初始值进行初始化。
一般来说,编译器有两种做法:
a) introduce a temporary object
还是以上文的函数声明 void foo(X x0);
调用进入后,1、编译器生成一个temporary object:X _temp;
2、以实际参数xx 拷贝构造 这个temporary object:_temp.X::X(xx);
3、重新改写函数调用操作,foo(_temp);
4、最重要的一点就是修改参数调用方式为引用,否则如何工作又回到原点啦。。。void foo(X &x0);
b) 将参数直接以copy constructor建构到函数的堆栈上,这样也会有一个local object生成;当然在函数返回时该local object也会被destructed。
3) 返回值的初始化(Return Value Initialization)
当返回值是object时,这个object是如何返回的呢?cfront使用的是一个双阶段转化:
a) 首先加上一个额外的参数,是class object的reference,这个参数将放置通过copy constructor得来的返回值
b)在return之前安插一个copy constructor,以便将欲传回之的object当做上述新增参数的处置。
例如:X bar() { X xx; return xx;} 会被转化为:
void bar(X & _res) //这里安插了临时引用参数
{
X xx;
xx.X::X();
_res.X::X(xx); //这里安插了临时引用的拷贝构造函数
return;
}
现在编译器必须转化每个bar调用,以反映其新定义。例如X xx = bar(); ===> X xx; bar( xx );
而相应的 bar().memfunc(); //执行bar()所返回之X class object的member function
会被编译器转化为:
X temp0;
(bar(temp0),temp0).memfunc();
在 返回值优化上,Optimization at the User Level or Optimization at the Compiler Level。在User Level, 设计者需要创建不同的constructor,这样object直接通过计算,而不需要copy constructor。这样做如果在非常注重效率的场合可能比较有意义,但是缺乏抽象。
在Compiler Level,现在广为认知的就是 Name Return Value(NRV)Optimization:
void bar(X & _res) //这里安插了临时引用参数
{
_res.X::X();
//直接操作_res
return;
}
也就是说,NRVO 省略了一次copy constructor的调用。但是如果copy constructor有side-effect的话,那么这个优化就会有问题。
书中提到,如果某个class 会有大量的object return value的情况,那么需要为该class define copy
constructor,以触发NRV(或者叫RVO, Return Value
Optimization)。但是,黄俊达先生认为:Lippman 在 p67 最後一行所言『这个程式的第一个版本不能实施 NRV 最佳化,因
为 test class 缺少一个 copy constructor』,
此语错误。黄先生认为如果程式没
有 explicit copy constructor,编译器会自动为我们做出来(如为 trivial,则直接 bitwise copy;如
为 nontrivial,则由编译器为我们合成出一个 copy constructor)。因此,有没有 explicit
copy constructor 并不影响 NRV 最佳化的实施。他认为 NRV 最佳化主要是
由编译器 option 来决定要不要实施。他并且做了一些实验,判断 VC 和 gcc
都没有做到 NRV 最佳化,而其不做的理由不是因为技术上的困难,是为了避免造成「user defined copy constructor 之副
作用失效」-- 所谓副作用
是指,例如「在 user defined copy constructor 中做一个 cout 输出」之类这种「与 memberwise copy 无关」的动作。
NRV优化还是很重要,比如下面的代码,如果没有NRV将会有三次copy 构造,二次析构:
Type get(int I) { return Type(i); } Type t = get(1);
甚至有人认为user defined copy constructor会阻止NRV的优化。更多讨论可以参见: 关于编译器对拷贝构造函数优化的问题再讨论