Effective C++ 学习笔记（14）

2011-08-03 23:59 Daniel Zheng 阅读(298) 评论(0) 收藏举报

在operator=中检查给自己赋值的情况

做类似下面的事时，就会发生自己给自己赋值的情况：

class X { ...};

X a;

a = a;

　　这种事做起来好象很无聊，但它完全是合法的，所以看到程序员这样做不要感到丝毫的怀疑。更重要的是，给自己赋值的情况还可以以下面这种看起来更隐蔽的形式出现：

a = b;

　　如果 b 是a 的另一个名字（例如，已被初始化为a 的引用），那这也是对自己赋值，虽然表面上看起来不象。这是别名的一个例子：同一个对象有两个以上的名字。在本条款的最后将会看到，别名可以以大量任意形式的伪装出现，所以在写函数时一定要时时考虑到它。

　　在赋值运算符中要特别注意可能出现别名的情况，其理由基于两点。其中之一是效率。如果可以在赋值运算符函数体的首部检测到是给自己赋值，就可以立即返回，从而可以节省大量的工作，否则必须去实现整个赋值操作.

　　另一个更重要的原因是保证正确性。一个赋值运算符必须首先释放掉一个对象的资源（去掉旧值），然后根据新值分配新的资源。在自己给自己赋值的情况下，释放旧的资源将是灾难性的，因为在分配新的资源时会需要旧的资源。

　　看看下面 String 对象的赋值，赋值运算符没有对给自己赋值的情况进行检查：

class String 
{
public:
  String(const char *value); 

  ~String(); // 函数定义参见条款11

...
  String& operator=(const String& rhs);
private:
  char *data;
};
// 忽略了给自己赋值的情况
// 的赋值运算符
String& String::operator=(const String& rhs)
{
  delete [] data; // delete old memory
  // 分配新内存，将rhs 的值拷贝给它
  data = new char[strlen(rhs.data) + 1];
  strcpy(data, rhs.data);
  return *this; 
}

　　看看下面这种情况将会发生什么：

String a = "Hello";
a = a; // same as a.operator=(a)

　　赋值运算符内部，*this 和rhs 好象是不同的对象，但在现在这种情况下它们却恰巧是同一个对象的不同名字。可以这样来表示这种情况：

*this data ------------> "Hello\0"

rhs data ------------

　　赋值运算符做的第一件事是用delete 删除data，其结果将如下所示：

*this data ------------> ???

rhs data -----------

　　现在，当赋值运算符对rhs.data 调用strlen 时，结果将无法确定。这是因为data被删除的时候 rhs.data 也被删除了，data，this->data 和rhs.data 其实都是同一个指针！从这一点看，情况只会越变越糟糕。

　　对此解决的方法：

　　如果两个对象具有相同的值，就说它们是相同的（具有相同的身份）。例如，两个String 对象如果都表示的是相同顺序的字符序列，它们就是相同的：

String a = "Hello";
String b = "World";
String c = "Hello";

　　a 和c 具有相同值，所以它们被认为是完全相同的；b 和它们都不同。如果把这个定义用到String 类中，赋值运算符看起来就象这样：

String& String::operator=(const String& rhs)
{
  if (strcmp(data, rhs.data) == 0) return *this;
...
}

　　值相等通常由operator==来检测，所以对于一个用值相等来检测对象身份的类C 来说，它的赋值运算符的一般形式是：

C& C::operator=(const C& rhs)
{
  // 检查对自己赋值的情况
  if (*this == rhs) // 假设operator=存在
    return *this;
...
}

　　注意这个函数比较的是对象（通过operator=），而不是指针。用值相等来确定对象身份和两个对象是否占用相同的内存没有关系；有关系的只是它们所表示的值。

　　另一个确定对象身份是否相同的方法是用内存地址。采用这个定义，两个对象当且仅当它们具有相同的地址时才是相同的。这个定义在C++程序中运用更广泛，可能是因为它很容易实现而且计算很快，而采用值相等的定义则不一定总具有这两个优点。采用地址相等的定义，一个普通的赋值运算符看起来象这样：

C& C::operator=(const C& rhs)
{
  // 检查对自己赋值的情况
  if (this == &rhs) return *this;
  ...
}

　　它对很多程序都适用。

　　如果需要一个更复杂的机制来确定两个对象是否相同，这就要靠程序员自己来实现。最普通的方法是实现一个返回某种对象标识符的成员函数：

class C {
public:
  ObjectID identity() const; //
  ...
};

　　对于两个对象指针 a 和b，当且仅当 a->identity() == b->identity()的时候，它们所指的对象是完全相同的。当然，必须自己来实现ObjectIDs 的operator==。别名和object identity 的问题不仅仅局限在operator=里。在任何一个用到的函数里都可能会遇到。在用到引用和指针的场合，任何两个兼容类型的对象名称都可能指的是同一个对象。下面列出的是别名出现的其它情形：

class Base 
{
  void mf1(Base& rb); // rb 和*this 可能相同
  ...
};
void f1(Base& rb1,Base& rb2); // rb1 和rb2 可能相同
//
class Derived: public Base 
{
  void mf2(Base& rb); // rb 和*this 可能相同
  //
  ...
};
int f2(Derived& rd, Base& rb); // rd 和rb 可能相同

　　可以看到，别名可以以各种形式出现，所以决不要忘记它或期望自己永远不会碰到它。也许你不会碰到，但我们大多数会碰到。而很明显的一条是，处理它会达到事半功倍的效果。所以任何时候写一个函数，只要别名有可能出现，就必须在写代码时进行处理。

刷新页面返回顶部

Daniel Zheng

Effective C++ 学习笔记（14）

About