代码改变世界

Effective C++ 学习笔记(14)

2011-08-03 23:59  Daniel Zheng  阅读(287)  评论(0编辑  收藏  举报

在operator=中检查给自己赋值的情况


做类似下面的事时,就会发生自己给自己赋值的情况:

class X { ...};

X a;

a
= a;

  这种事做起来好象很无聊,但它完全是合法的,所以看到程序员这样做不要感到丝毫的怀疑。更重要的是,给自己赋值的情况还可以以下面这种看起来更隐蔽的形式出现:

a = b;

  如果 b 是a 的另一个名字(例如,已被初始化为a 的引用),那这也是对自己赋值,虽然表面上看起来不象。这是别名的一个例子:同一个对象有两个以上的名字。在本条款的最后将会看到,别名可以以大量任意形式的伪装出现,所以在写函数时一定要时时考虑到它。

  在赋值运算符中要特别注意可能出现别名的情况,其理由基于两点。其中之一是效率。如果可以在赋值运算符函数体的首部检测到是给自己赋值,就可以立即返回,从而可以节省大量的工作,否则必须去实现整个赋值操作.

  另一个更重要的原因是保证正确性。一个赋值运算符必须首先释放掉一个对象的资源(去掉旧值),然后根据新值分配新的资源。在自己给自己赋值的情况下,释放旧的资源将是灾难性的,因为在分配新的资源时会需要旧的资源。

  看看下面 String 对象的赋值,赋值运算符没有对给自己赋值的情况进行检查:

class String 
{
public:
String(
const char *value);

~String(); // 函数定义参见条款11

...
String
& operator=(const String& rhs);
private:
char *data;
};
// 忽略了给自己赋值的情况
// 的赋值运算符
String& String::operator=(const String& rhs)
{
delete [] data;
// delete old memory
// 分配新内存,将rhs 的值拷贝给它
data = new char[strlen(rhs.data) + 1];
strcpy(data, rhs.data);
return *this;
}

  看看下面这种情况将会发生什么:

String a = "Hello";
a
= a; // same as a.operator=(a)

  赋值运算符内部,*this 和rhs 好象是不同的对象,但在现在这种情况下它们却恰巧是同一个对象的不同名字。可以这样来表示这种情况:

  *this data ------------> "Hello\0"

                                   /

                                 /

  rhs data ------------

  赋值运算符做的第一件事是用delete 删除data,其结果将如下所示:

  *this data ------------> ???

                                   /

                                 /

  rhs data -----------

  现在,当赋值运算符对rhs.data 调用strlen 时,结果将无法确定。这是因为data被删除的时候 rhs.data 也被删除了,data,this->data 和rhs.data 其实都是同一个指针!从这一点看,情况只会越变越糟糕。

  对此解决的方法:

  如果两个对象具有相同的值,就说它们是相同的(具有相同的身份)。例如,两个String 对象如果都表示的是相同顺序的字符序列,它们就是相同的:

String a = "Hello";
String b
= "World";
String c
= "Hello";

  a 和c 具有相同值,所以它们被认为是完全相同的;b 和它们都不同。如果把这个定义用到String 类中,赋值运算符看起来就象这样:

  

String& String::operator=(const String& rhs)
{
if (strcmp(data, rhs.data) == 0) return *this;
...
}

  值相等通常由operator==来检测,所以对于一个用值相等来检测对象身份的类C 来说,它的赋值运算符的一般形式是:

C& C::operator=(const C& rhs)
{
// 检查对自己赋值的情况
if (*this == rhs) // 假设operator=存在
return *this;
...
}

  注意这个函数比较的是对象(通过operator=),而不是指针。用值相等来确定对象身份和两个对象是否占用相同的内存没有关系;有关系的只是它们所表示的值。

  另一个确定对象身份是否相同的方法是用内存地址。采用这个定义,两个对象当且仅当它们具有相同的地址时才是相同的。这个定义在C++程序中运用更广泛,可能是因为它很容易实现而且计算很快,而采用值相等的定义则不一定总具有这两个优点。采用地址相等的定义,一个普通的赋值运算符看起来象这样:

  

C& C::operator=(const C& rhs)
{
// 检查对自己赋值的情况
if (this == &rhs) return *this;
...
}

  它对很多程序都适用。

  如果需要一个更复杂的机制来确定两个对象是否相同,这就要靠程序员自己来实现。最普通的方法是实现一个返回某种对象标识符的成员函数:

  

class C {
public:
ObjectID identity()
const; //
...
};

  对于两个对象指针 a 和b,当且仅当 a->identity() == b->identity()的时候,它们所指的对象是完全相同的。当然, 必须自己来实现ObjectIDs 的operator==。别名和object identity 的问题不仅仅局限在operator=里。在任何一个用到的函数里都可能会遇到。在用到引用和指针的场合,任何两个兼容类型的对象名称都可能指的是同一个对象。下面列出的是别名出现的其它情形:

  

class Base 
{
void mf1(Base& rb); // rb 和*this 可能相同
...
};
void f1(Base& rb1,Base& rb2); // rb1 和rb2 可能相同
//
class Derived: public Base
{
void mf2(Base& rb); // rb 和*this 可能相同
//
...
};
int f2(Derived& rd, Base& rb); // rd 和rb 可能相同

  可以看到,别名可以以各种形式出现,所以决不要忘记它或期望自己永远不会碰到它。也许你不会碰到,但我们大多数会碰到。而很明显的一条是,处理它会达到事半功倍的效果。所以任何时候写一个函数,只要别名有可能出现,就必须在写代码时进行处理。