透过IL看C# (1)——switch语句（上）

透过IL看C# (1)
switch语句（上）

原文地址：http://www.cnblogs.com/AndersLiu/archive/2008/11/03/csharp-via-il-switch-1.html

摘要：switch语句是C#中常用的跳转语句，可以根据一个参数的不同取值执行不同的代码。本文介绍了当向switch语句中传入不同类型的参数时，编译器为其生成的IL代码。这一部分介绍的是，在switch语句中使用整数类型和枚举类型的情况。

switch语句是C#中常用的跳转语句，可以根据一个参数的不同取值执行不同的代码。switch语句可以具备多个分支，也就是说，根据参数的N种取值，可以跳转到N个代码段去运行。这不同于if语句，一条单独的if语句只具备两个分支（这是因为if语句的参数只能具备true或false两种取值），除非使用嵌套if语句。

switch语句能够接受的参数是有限制的，简单来说，只能是整数类型、枚举或字符串。本文就从整数、枚举和字符串这三种类型的switch语句进行介绍。

switch指令

在进入正题之前，先为大家简要介绍一下IL汇编语言中的switch指令。switch指令（注意和C#中的switch语句区分开）是IL中的多分支指令，它的基本形式如下：

switch (Label_1, Label_2, Label_3…)

其中switch是IL关键字，Label_1~Label_N是一系列标号（和goto语句中用到的标号一样），标号指明了代码中的位置。这条指令的运行原理是，从运算栈顶弹出一个无符号整数值，如果该值是0，则跳转到由Label_1指定的位置执行；如果是1，则跳转到Labe_2；如果是2，则跳转到Label_3；以此类推。

如果栈顶弹出的值不在标号列表的范围之内（0~N-1），则忽略switch指令，跳到switch指令之后的一条指令开始执行。因此，对于switch指令来说，其 “default子句”是在最开头的。

此外，Label_x所引用的标号位置只要位于当前方法体就可以，不必非要在switch指令的后面。

好了，后面我们会看到switch指令的实例的。

使用整数类型的switch语句

代码1 - 使用整数类型参数的switch语句，取值连续

代码1中的switch语句接受的参数n是int类型的，并且我们观察到，在各个case子句中的取值都是连续的。将这段代码写在一个完整的程序中，并进行编译。之后使用ildasm打开生成的程序集，可以看到对应的IL代码如代码2所示。

代码2 – 代码1生成的IL代码

我们可以看到，首先IL_0000和IL_0001两行代码将参数n存放到一个局部变量中，然后IL_0002到IL_0004三行将这个变量的值减去1，并将结果留在运算栈顶。啊哈，参数值减去1，要进行判断的几种情况不就变成了0、1、2了么？是的。在接下来的switch指令里，针对这三种取值给出了三个地址IL_0017、IL_0022和IL_002d。这三个地址处的代码，分别就是取值为1、2、3时需要执行的代码。

以上是取值连续的情形。如果各个case子句中给出的值并不连续呢？我们来看一下下面的C#代码：

代码3 – 使用整数类型参数的switch语句，取值不连续

代码3编译生成的程序集中，编译器生成的IL代码如下：

代码4 – 代码3生成的IL代码

看到代码4，第一感觉就是switch指令中跳转地址的数量和C#程序中switch语句中的取值数不相符。但仔细观察后可以发现，switch指令中针对0、2、4（即switch语句中的case 1、3、5）这三种取值给出了不同的跳转地址。而对于1、3这两种取值（在switch语句中并没有出现）则给出了同样的地址IL_003f，看一下这个地址，是语句ret。

也就是说，对于取值不连续的情况，编译器会自动用“default子句”的地址来填充switch指令中的“缝隙”。当然，代码4因为过于简单，所以“缝隙值”直接跳转到了方法的结尾。

那么，如果取值更不连续呢？那样的话，switch指令中就会有大量的“缝隙值”。要知道，switch指令和之后的跳转地址列表都是指令的一部分，缝隙值的增加势必会导致程序集体积的增加啊。呵呵，不必担心，编译器很聪明，请看下面的代码：

代码5 – 使用整数类型参数的switch语句，取值非常不连续

在代码5中，switch语句的每个case子句中给出的取值之间都相差20，这意味着如果再采用前面所述“缝隙值”的做法，switch指令中将有多达41个跳转地址，而其中有效的只有3个。但现代的编译器明显不会犯这种低级错误。下面给出编译器为代码5 生成的IL：

代码6 – 代码5生成的IL代码

从代码6中我们会发现，switch指令不见了，在IL_0005、IL_000a和IL_000f三处分别出西安了beq.s指令，这个指令是beq指令的简短形式。当跳转位置和当前位置之差在一个sbyte类型的范围之内时，编译器会自动选择简短形式，目的是缩小指令集的体积。而beq指令的作用是从运算栈中取出两个值进行比较，如果两个值相等，则跳转到目标位置（有beq指令后面的参数指定）执行，否则继续从beq指令的下一条指令开始执行。

由此可见，当switch语句的取值非常不连续时，编译器会放弃使用switch指令，转而用一系列条件跳转来实现。这有点类似于if-else if-...-else语句。

使用枚举类型的switch语句

.NET中的枚举是一种特殊的值类型，它必须以某一种整数类型作为其底层类型（underlying type）。因此在运算时，枚举都是按照整数类型对待的，switch指令会将栈顶的枚举值自动转换成一个无符号整数，然后进行判断。

因此，在switch语句中使用枚举和使用整数类型没有太大的区别。请看下面一段代码：

代码7 - 在switch语句中使用枚举类型

其中的Num类型是一个枚举，定义为public enum Num { One, Two, Three }

下面是编译器为代码7生成的IL代码：

代码8 - 代码7生成的IL代码

可以看到，代码8和代码2没有什么本质区别。这是因为枚举值就是按照整数对待的。并且，如果枚举定义的成员取值不连续，生成的代码也会和代码4、代码6类似。

小结

本文介绍了编译器如何翻译使用整数类型的switch语句。如果你很在乎微乎其微的效率提升的话，应记得：

尽量在switch中使用连续的取值；
如果取值不连续，则使用尽量少的case子句，并将出现频率高的case放在前面（因为此时switch语句和if-else if-else语句是类似的）。

返回目录：透过IL看C#

posted @ 2008-11-03 22:42 Anders Liu 阅读(7405) 评论(27) 编辑收藏举报

刷新页面返回顶部

透过IL看C# (1)——switch语句（上）

透过IL看C# (1)switch语句（上）

switch指令

使用整数类型的switch语句

使用枚举类型的switch语句

小结

公告

透过IL看C# (1)
switch语句（上）