[译]GotW #1: Variable Initialization

原文地址:http://herbsutter.com/2013/05/09/gotw-1-solution/   

第一个问题强调的是要明白自己在写什么的重要性。下面有几行简单的代码--它们大多数之间都有区别,尽管在语法上只有轻微的不一样。

Problem

JG Question

1. 下面代码存在差异吗?

widget w;            // ( a )

widget w();           // ( b )
widget w{};           // ( c )

widget w( x );        // ( d )
widget w{ x };        // ( e )

widget w = x;            // ( f )
widget w = { x };        // ( g )

auto w = x;               // ( h )
auto w = widget { x };    // ( i )

Guru Questions

2. 下面每行代码都做了什么?

vevtor<int> v1 (10, 20);    // ( a )
vector<int> v2 { 10, 20};   // ( b )

3. 除了上面代码,使用{}初始化对象还有什么其他好处?

4. 在什么时候应该使用()或者{ }语法来初始化对象?为什么?

Solution

上面的代码说明了一下几件事情:

  · 默认初始化、直接初始化、拷贝初始化和列表初始化之间的区别。

  · 使用()和{ }初始化的区别。

  · A red herring that isn’t initialization at all( 译注:),现代C++应彻底避免。

最重要的是:如果坚持在#4节介绍的两个原则,就可以忽略上面的大多数情况,规则很简单,却可以在默认的情况下提供高效的性能。

Answer 1.

(a)是默认初始化

widget w;        // ( a )

上面代码声明了一个类型为widget,名字叫w的变量,对于大多数类型,它们是使用默认的构造函数widget::widget()来初始化的。

要注意的是,如果widget是内建类型,比如int或者一些类似int(int-like)的

  1.依赖编译器为它们产生默认的构造函数,

  2.且没有虚函数或者

  3.虚基类或者

  4数据成员初始化函数

的类型或者满足类似满足上述条件的类型,那么w是没有被初始化的,且包含了一些“垃圾”值。

(b)是令人烦恼的red herring(转移注意力的话题),现在主要属于一个历史性的玩意。

widget w();    // ( b )

这是一个前-现代C++的陷阱:大致一看,它好像是一个使用默认构造函数widget::widget()的变量声明语句,但是这里存在一个个语法的二义性。它可以是一个名字为w的,不带参的,返回值为widget的(传值)的函数声明。

免得可以能会认为:“这里的圆括号()是多余的,这是程序员自己犯的错,他可以写成widget w;这样”。但是要注意的是存在着一个偶然的情况下会引起同样的问题,比如可能会用临时变量来初始化:

// same problem ( gadget and dooead are types )

widget w( gadget( ), doodad( ) );    // pitfall: not a variable declaration

Scott Meyers老早前就把它命名为“C++’s most vexing parse(C++最棘手的解析)”。因为C++标准在面对这样的二义性时,是以“如果它可以是一个函数声明,那么它就是函数声明”为标准的。

好消息是,这只是属于历史的一个玩意,在现代C++代码中应该是不会遇到的,因为C++11移除了这陷阱。注意C++11并没有改变代码的意思,C++11对C++98有着很强的向后兼容性,同样包括这样的二义性。C++11是通过提供一个语法,几乎在所有情况下来取代(b)这种情况,因此没必要再次掉入这样的陷阱当中了,如:

(c)是非棘手且明确的

widget w{ };    // ( c )

我们有了第一个优先选择{}的理由:对于任意类型widget,上面代码做了(a)和(b)应该做的事--总是初始化变量,且它不会存在函数声明的二义性。没有烦恼,没有混乱。

“啊,等等,没有它看上去那么简单!”有人可能会反对。“假如widget有一个带std::initializer_list参数的构造函数怎么办?因此如果有的话,就不能这样调用的吧?”

答案是否定的,它就是看上去那么简单。因为标准明确:一个空的{}列表意味着调用默认的构造函数,如果有的话。但是,应该注意有std::initializer_list这样的情况,接着看下一个。

(d)和(e)都是直接初始化

现在考虑从已存在的变量来初始化w的情况:

widget w(x);                // (d)
widget w{x};                // (e)

假设x不是一个类型名,上面两个都是直接初始化。因为变量w通过调用widget::widget(x)“直接”从x的值来初始化。如果x也是widget类型,那么会调用拷贝构造函数,否则,调用一个转换构造函数。然而要注意,{x}语法创建了一个initializer_list,如果widget有一个带initializer_list参数的构造函数,那么这个构造函数会被优先选择。否则,如果widget有一个带任意类型x的构造函数,那么此构造函数则会被调用。
相对于(d)优先选择(e)有两个主要的区别:

第一,像(c)一样,(e)是一个没有二义性且避免了棘手的解析。如果x是一个类型名,那么(d)就是一个函数声明语句,即使在作用域范围内存在一个同名的x变量,而(e)绝不可能是个函数声明语句。

第二,(e)更安全,因为它不允许值变窄(narrowing,又名“lossy”)转换,不允许一些内置的类型,比如:

int i1( 12.345 );           // ok: toss .345, we didn't like it anyway
int i2{ 12.345 };           // error: would be lossy implicit narrowing

(f)和(g)是拷贝初始化和拷贝列表初始化
这是最后两个非auto的情况:

widget w = x;               // (f)

这称为“拷贝初始化”,从概念上来说,变量w使用widget的移动或拷贝构造函数来初始化,可能在隐式地调用其它函数来转换这个参数之后。(这里不会调用explicit转换)

 

   Common Mistake:这总是初始化,它绝不会是赋值,因此绝不会调用T::operator=()。我知道那里有个“=”字符,but don’t let that throw you。那只是一个C的延续语法,不是赋值操作。


下面是它们的语义:
  · 如果x是widget类型,(f)和(d)widget w(x)的意义是相同的,除了explicit构造函数不能使用之外。它保证了只有一个构造函数被调用。
  · 如果x是其他类型,从概念上来说,编译器会先隐式地将x转换成一个临时的widget对象,然后对临时右值使用移动构造函数,如果没有移动构造函数,那么使用拷贝构造函数    作为后备。假设可以隐式转换,那么(f)的意义和widget w( widget(x) );是相同的。

注意到上面说了几次“从概念上”,那是因为实际中编译器允许,且经常地优化掉临时对象,如果可以隐式转换,从(f)到(d),因此优化掉多余的移动操作。然而,即使当编译器这么做,widget的拷贝构造函数任然必须是可访问的,即使不被调用,拷贝构造函数的副作用可能会也可能不会发生,that’s all.

现在看一下追加了“=”的相关语法:

widget w = {x};             // (g)

这个称为“拷贝列表初始化”。它的意思和widget w{x};相同。除了explicit构造函数不能使用之外。它保证了只有一个构造函数被调用。

(h)和(i)都是拷贝初始化,但更简单

auto w = x;                 // (h)
auto w = widget{x};         // (i)

语义正如(f)和(g),除了更方便教学、学习和使用。因为使用auto保证了右手端的表达式类型会被精确地推导。要注意的是语句(i)对于隐式和显示的转换都能工作。

(h)行的意思和(d)相同,type_of_x w(x);。只有一个构造函数被调用。它保证了在程序演变过程中的一致性:因为(h)行没有承诺一个显示的类型,它同时保证了效率的最大化(因为没有涉及转换)和健壮性的最大化(因为w类型会“自动”地跟踪类型,如果程序在维护中改变的情况下)

当你想要确定一个指定的类型和需要显示转换,那么(i)行是最一致的使用手段。再一次,{}语法避免了有损收缩转换。实际上在多数编译器中,只有一个构造函数会被调用,和我们在(f)和(g)看到的一样。从概念上说调用了两个构造函数,一个转换或者一个拷贝构造函数创建一个临时的widget{x},紧接着通过移动构造将它“移动”到w,但是编译器经常会省略(优化)后者。

一般来说,我建议你尝试上面两种形式的语句。随着你习惯了它们之后就会越来越喜欢使用它们。我现在倾向于使用这种方式来声明所有局部变量。(我知道你们当中有些人会怀疑这种用法,更多关于“auto的问题”在另外一篇GotW中)。

posted @ 2013-09-19 15:52  Navono  阅读(237)  评论(0编辑  收藏  举报