IL代码底层运行机制(转)

IL代码底层运行机制

刘强

Cambest@sohu.com

2003年5月8日

大家都知道，和Java一样，C#也是基于堆栈的语言。也许对一般人来说，底层的运行细节并不是很重要；但了解这些，对我们理解、运用C#是很有帮助的。下面，我就通过一个很简单的例子来说明IL代码的底层运行机制，也许对你会有一些帮助。

我给出的例子表面上看是一个实现整数相减功能的函数；实际上，我也不知道究竟能够干什么。在实际当中，我们的程序当中会有很多种数据类型、引用类型，为了简便起见，我所给出的示例代码只用了一种数据类型，如下所示：

public int Sub(int i,int j)

{

int s;

int t = 0;

int r = 4;

s=i;

r =i – j;

r + =s + t;

return r;

}

这段代码很简单，任何学过C#的人都能看懂。首先，传入两个整型变量i和j，然后经过内部运算，返回一个整型值。函数体内定义了三个局部变量s，t， r，分别用于保存自定义值以及结果。我们可以将它包装进一个类中，然后将它编译成.dll装配件。运用VS.NET自带的ildasm反汇编工具进行反汇编，我们得到如下IL代码：

.method public hidebysig instance int32 Sub(int32 i, int32 j) cil managed

{

// Code size 22 (0x16)

.maxstack 3

.locals init (int32 V_0, int32 V_1, int32 V_2, int32 V_3)

ldc.i4.0

stloc.1

ldc.i4.4

stloc.2

ldarg.1

stloc.0

ldarg.1

ldarg.2

sub

stloc.2

ldloc.2

ldloc.0

ldloc.1

add

stloc.2

ldloc.2

stloc.3

br.s IL_0014

ldloc.3

ret

}

IL代码也可以由VS.NET自带的IL编译工具ilasm编译为.dll装配件或.exe可执行文件。

这里，我要对IL中出现的符号作一下简单解释。以点号’.’开头的标号为伪指示代码，只起指示作用，最终不会被JIT编译为本地可执行代码，如“.method”，“.locals”等。而不带点号’.’的标号为IL汇编代码，它们在运行时将会被JIT编译为本地可执行代码，如“ldarg.1”等。

每条语句究竟代表了什么样的操作，我们下面在详细讲解。注意：局部变量的下标从0开始，因此要注意我下面所说的“第零个局部变量”等的含义。

首先，让我们看一看函数体内的第一条语句：.maxstack 3。从其本身我们也可以猜出该语句说明堆栈的大小。暂且不表，且看下文。

第二句：.locals init (int32 V_0, int32 V_1, int32 V_2, int32 V_3) 。V_0、V_1、V_2和我们在CS源程序中定义的局部变量s，t，r一一对应，我们大概也能猜到这一句是完成局部变量初始化工作的，但为什么在这里是四个呢？我们明明只定义了三个变量的。那么这由C#编译器自动维护的第四个变量有何作用？也暂且不表，先看下文。

ldc.i4.0

这条语句作用是在堆栈中载入常数，i4表示该常数为双字长的32位整型数，初始值为0。“ldc”可以理解为“load constant”，加载常数。如图a，它完成的操作如同(top)<=0，top=top+1。

stloc.1

这条语句作用是将当前栈顶元素存入第一个局部变量。’1’表示操作对象为第一个局部变量。“stloc”可以理解为“store to local”，保存局部变量。如图b，它完成的操作如同top=top-1，s<=(top)。

ldc.i4.4

这条语句完成的操作如同(top)<=4，top=top+1，如图c。

stloc.2

这条语句完成的操作如同top=top-1，t<=(top)，如图d。

ldarg.1

ldarg.2

这两条语句作用是在堆栈中载入第一个参数（i）、第二个参数（j）（和局部变量不同，参数的指示下标从1开始）。它完成的操作如同 (top)<=i，top=top+1，（top）<=j，top=top+1，如图e。其中，“ldarg”可以理解为“load argument”，加载参数。

sub

这条语句作用是将当前栈顶元素求反，再下加到第二个栈单元中，如图f。它完成的操作如同top=top-1，temp= -（top），top=top-1，（top）=（top）+ temp，top=top+1。

top

i-j

(a) (b) (c) (d) (e) (f)

stloc.2

这条语句作用是将当前栈顶元素存入第二个局部变量(r)。它完成的操作如同top=top-1，r<=(top)，即r=i-j，如图

ldloc.2

ldloc.0

ldloc.1

这三条语句作用是分别将第二、第零个、第一个局部变量加载到堆栈上，如图h。“ldloc”可以理解为“load local variable”，加载局部变量。

add

add的用发和sub一样，只不过不将当前栈顶元素求反，再下加到第二个栈单元中，连续操作两次。如图i、j。

stloc.2

将当前栈顶元素存入第二个局部变量。如图k。

ldloc.2

在堆栈中载入第二个局部变量（r），如图l。

top

r+s+t

top

s+t

top

(g) (h) (i) (j) (k) (l)

stloc.3

将当前栈顶元素存入第三个局部变量，亦即保存返回值，如图m所示。

br.s IL_0014

跳转到下一句（ldloc.3）。如图n所示。

ldloc.3

ret

将第三个局部变量（也即由编译器自动维护的变量）加载到堆栈上，然后返回，如图o。从这里我们也可以看出，1、第三个变量和返回值类型相同；2、扫尾后、返回前将第三个局部变量加载至堆栈。这可以让我们确定：第三个变量用于存储返回值。我们还要弄清楚为什么要专门分配一个局部变量来存储返回值，这一点在后面会有说明。

top

V_3

(m) (n) (o)

综观图a~o，我们回发现，整个函数过程所用到的最大栈数目就是3，这也就不难理解第一条语句.maxstack 3 了。

现在，还有一点让人迷惑的是为什么要引入变量V_3？如上例中，倒数第二条指令ldloc.3也可以由ldloc.2代替，因为我们所要的结果就是存储在第二个变量r中的，这不是浪费空间嘛。要注意了，并不所有的返回值都保存在局部变量中的。

有可能我们将参数直接返回，或者将类成员变量返回，如：

public int Laxi(int x)

{

return x; //直接将参数返回

}

或者是 int age;...

public int GetAge()

{

return age; //返回在类中定义的字段

}

或者是直接返回一个表达式：

public int GetInteger()

{

return age+4*6/2;

}

则必须进行这一步转换，以return r为例：ldloc.x -> stloc.y ->ldloc.y ->ret . 因为在以上三种情况当中，返回值都不存储在局部变量当中。

http://www.chinaaspx.com/archive/dotnet/14438.htm

posted on 2007-09-15 23:00 钢钢阅读(751) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

XuGang

IL代码底层运行机制(转)

导航

统计

公告

搜索

常用链接

我的标签

积分与排名

随笔分类 (342)

随笔档案 (301)

文章分类 (26)

Blog

DotNET Tool

Other Tool

Total

Web Design Tool

Website

图像相关工具

阅读排行榜

评论排行榜

推荐排行榜

最新评论