条款11:优先采用foreach循环语句

C#的foreach语句不仅仅只是do...while或者for循环语句的一个变体。它会为我们的集合产生最好的遍历代码。实际上,foreach语句的定义和.NET框架中的集合接口密切相关。对于一些特殊的集合类型,C#编译器会产生具有最佳效率的代码。遍历集合时,我们应该使用foreach语句,而非其他的循环构造。例如,对于下面三种循环:

条款11:优先采用foreach循环语句  70

 
int [] foo = new int[100];

// 循环1:

foreach ( int i in foo)

  Console.WriteLine( i.ToString( ));

// 循环2:

for ( int index = 0;

  index < foo.Length;

  index++ )

  Console.WriteLine( foo[index].ToString( ));

// 循环3:

int len = foo.Length;

for ( int index = 0;

  index < len;

  index++ )

  Console.WriteLine( foo[index].ToString( ));

对于当前和将来的C#编译器(版本1.1及其以上版本),第1个循环产生的代码最优,而且需要键入的字符也最少,因此程序员的开发效率也比较高。(不过在C# 1.0编译器下,第1个循环产生的代码效率较慢,第2个循环产生的代码效率最好。)大多数C和C++程序员认为效率最高的第3循环,反而是最坏的选择。通过将Length变量放到循环之外,我们实际上阻碍了JIT编译器移除循环中的范围检查。

C#代码运行在一个安全、托管的环境中。每一个内存位置都会被检查,包括数组索引。事实上,第3个循环所产生的代码和如下的代码等效:

// 循环3, 和编译器产生的代码等效:

int len = foo.Length;

for ( int index = 0;

  index < len;

  index++ )

{

  if ( index < foo.Length )

    Console.WriteLine( foo[index].ToString( ));

  else

    throw new IndexOutOfRangeException( );

}

JIT和C#编译器并不“喜欢”我们用这种方式来帮助它们。将Length属性放到循环之外只会让JIT编译器做更多的工作,产生的代码也更慢。CLR会确保我们写的代码不会滥用变量拥有的内存。CLR会在访问每一个特定数组元素之前,产生一个数组界限(并非上面的len变量)测试。如果我们像上面那样写代码,每一个数组界限测试会被执行两次。

在循环的每一次迭代中,我们都要对数组索引做两次检查。第1个循环和第2个循环更快的理由在于C#编译器和JIT编译器可以确保循环中的数组界限是安全的。只要循环变量不是数组的Length属性,每一次迭代时都会执行数组界限检查。

对于1.0版本的C#编译器,在数组上使用foreach语句产生的代码比较慢的原因在于装箱操作(有关装箱的详细讨论,参见条款17)。在.NET中,数组是类型安全的。1.1版本之后的C#编译器会为数组与其他集合产生不同的IL。在1.0版本的编译器产生的代码中,在数组上使用foreach语句实际上是通过IEnumerator接口来遍历数组,而这会导致装箱与拆箱操作:

IEnumerator it = foo.GetEnumerator( );

while( it.MoveNext( ))

{

  int i = (int) it.Current; // 这里将出现装箱和拆箱。

  Console.WriteLine( i.ToString( ) );

}

相反,对于1.1版本之后的C#编译器,在数组上使用foreach语句将产生类似如下的构造:

for ( int index = 0;

  index < foo.Length;

  index++ )

  Console.WriteLine( foo[index].ToString( ));

由于foreach语句总会产生最佳的代码,所以我们不必刻意去记忆哪种构造会产生最高效的循环构造——foreach和编译器会为我们做这些工作。

如果效率还不能说服大家,那么来看看语言互操作的情况。总有一些人(其中的大多数人都有使用其他一些编程语言的经验)坚定地认为数组的起始索引变量应该从1(而非0)开始。不管我们怎么费力地说服他们,都无法改变他们的这个习惯。.NET开发组在这个问题上已经尽力了。我们可以在C#语言中用如下的初始化方式,来获得一个起始索引不为0的数组:

条款11:优先采用foreach循环语句  73

 
// 创建一个一维数组,范围为 [ 1 .. 5 ]。

Array test = Array.CreateInstance( typeof( int ),

new int[ ]{ 5 }, new int[ ]{ 1 });

很多人面对这样的代码可能会退缩,转而使用起始索引为0的数组。但是总有一些人对此比较顽固。不管你怎么努力,这些人都会坚持从1开始索引数组。幸运地是,在这个问题上我们可以使用foreach语句来蒙混编译器:

foreach( int j in test )

  Console.WriteLine ( j );

这里的foreach语句知道如何获得数组的上下界,因此就不必烦劳我们——而且其效率和我们手写的for循环一样快,不管其他人采用的数组下界是多少,我们使用这种做法都可以正常工作。

另外,foreach语句还可以为我们带来其他好处。其中的循环变量是只读的——也就是说我们不能替换foreach语句中的集合对象。而且还存在一个显式强制转型。如果集合中保存的对象类型不正确,迭代语句将抛出一个异常。

对于多维数组,foreach语句也有类似的好处。假设我们要创建一个棋盘,我们可能会编写如下的两段代码:

private Square[,] _theBoard = new Square[ 8, 8 ];

// 另外地方的代码:

for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )

  for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )

    _theBoard[ i, j ].PaintSquare( );

使用foreach语句,我们可以将上面的遍历代码做如下的简化:

foreach( Square sq in _theBoard )

  sq.PaintSquare( );

不管数组的维数是多少,foreach语句都会产生正确的遍历代码。如果我们之后又要做一个3D棋盘,上面的foreach循环仍然会正常工作。而其他手写的循环代码就需要更改了:

for ( int i = 0; i < _theBoard.GetLength( 0 ); i++ )

  for( int j = 0; j < _theBoard.GetLength( 1 ); j++ )

    for( int k = 0; k < _theBoard.GetLength( 2 ); k++ )

      _theBoard[ i, j, k ].PaintSquare( );

事实上,对于在每一维上拥有不同下界的多维数组来讲,foreach循环也会正常工作。这里我就不再编写这样的示例代码了。如果有人使用那样的集合,我们要知道foreach语句也能处理它。

如果我们刚开始使用的是数组,后来又需要转向其他数据结构,foreach语句允许我们不用更改绝大多数代码,从而保持代码的灵活性。假设我们刚开始有如下一个简单的数组:

int [] foo = new int[100];

但过了一段时间后,我们发现该数组无法方便地处理我们需要的某种功能。这时候,我们选择将数组更改为ArrayList:

// 设置初始大小:

ArrayList foo = new ArrayList( 100 );

这样更改之后,任何手写的for循环代码都将遭到破坏:

int sum = 0;

for ( int index = 0;

  // 下面的代码将不能编译:ArrayList 使用Count,而非Length。

  index < foo.Length;

  index++ )

  //下面的代码将不能编译:foo[ index ] 是一个object,而非int。

  sum += foo[ index ];

而使用foreach语句,它会编译为不同的代码,自动将每一个操作数强制转换为正确的类型。我们在代码上无需做任何更改。事实上,使用foreach语句不仅可以更改为标准集合类型——任何集合类型都可以使用foreach。

如果我们支持.NET环境为集合所定义的规则,用户便可以使用foreach来遍历我们的类型成员。要让foreach语句将一个类看做集合类型,该类必须拥有一些属性。总共有3种方式可以使一个类成为集合类:类型具备一个公有的GetEnumerator()方法;类型显式实现了IEnumerable接口;类型实现了IEnumerator接口[25]。

条款11:优先采用foreach循环语句  74

 
最后,foreach语句还会为我们在资源管理方面带来额外的好处。IEnumerable接口只包含一个方法:GetEnumerator()。在一个支持IEnumerable接口的类型上使用foreach语句会产生类似如下的代码(会有一些优化):

IEnumerator it = foo.GetEnumerator( ) as IEnumerator;

using ( IDisposable disp = it as IDisposable )

{

  while ( it.MoveNext( ))

  {

    int elem = ( int ) it.Current;

    sum += elem;

  }

}

如果编译器可以确定类型对IDisposable接口的实现情况,那么它就会自动优化finally块中的语句[26]。

综上所述,foreach是一个非常有用的语句。它会使用最高效的构造为“数组的上下界索引”、“多维数组遍历”和“操作数转型”产生正确的代码,并且产生的是最具效率的循环结构。它是遍历集合的最佳方式。使用它,我们编写的代码将比较“经久耐用”,而且在刚开始编写的时候也比较简单。使用foreach为我们带来的开发效率提升可能很少,但是随着时间的推移,它的效益会不断增长。
posted @ 2007-07-09 10:39  四两  阅读(288)  评论(0编辑  收藏  举报
加油,哥们,现在开始!