读懂IL代码就这么简单(二)
一 前言
IL系列 第一篇写完后 得到高人指点,及时更正了文章中的错误,也使得我写这篇文章时更加谨慎,自己在了解相关知识点时,也更为细致。个人觉得既然做为文章写出来,就一定要保证比较高的质量,和正确率 。感谢 @冰麟轻武 的指点
你没有看第一篇? 点这里看第一篇 读懂IL代码就这么简单(一)
IL指令大全 :IL指令详解
IL反编译工具: ILDasm
知识点回顾:
Managed Heap(托管堆):用于存放引用类型的值
Evaluation Statck(计算栈):临时存放值类型数据,引用类型地址的堆栈(这个是栈,所以遵循栈的操作特点,先进后出)
Call Stack(调用栈):其中的Record Frame 用于存放.locals init(int32 V_0)指令的参数值如:V_0 (Record Frame是一个局部变量表,所以不遵守FILO原则 )
二 指令详解(基本介绍)
2.1 知识点介绍
在第一篇时,我只详细的写了值类型的IL指令,这一篇会主要以引用类型为主,这一篇会有装箱操作,所以先写一下装箱操作在内存中是如何操作的
装箱操作:1 内存分配,在托管堆中分配内存空间,2 将值类型的字段拷贝到新分配的内存中,3 将托管堆中的对象地址返回给新的对象
操作过程如下图
C#代码
1 /* 2 Author:zery-zhang 3 BlogAddress:http://www.cnblogs.com/zery/ 4 */ 5 static void Main(string[] args) 6 { 7 string name = "Zery"; 8 int age = 22; 9 Console.WriteLine(age.ToString() + name);//已ToString的操作 10 Console.WriteLine(age+name);//未ToString操作 11 12 }
IL代码
1 /* 2 Author:zery-zhang 3 BlogAddress:http://www.cnblogs.com/zery/ 4 */ 5 .method private hidebysig static void Main(string[] args) cil managed 6 { 7 .entrypoint 8 // Code size 48 (0x30) 9 10 //以下代码 完成 C#代码中初始化变量的操作 11 12 //计算栈(Evaluation Stack) 可容纳数据项的最大个数 13 .maxstack 2 14 //定义并初始化参数 并存入 局部变量表(Record Frame)中 15 .locals init (string V_0,int32 V_1) 16 IL_0000: nop 17 //把字符串压入计算栈(Evaluation Stack)中 18 IL_0001: ldstr "Zery" 19 // 从计算栈中弹出("Zery")字符,并赋值给局部变量表中第0个位置的元素V_0 20 IL_0006: stloc.0 21 //把整数22压入计算栈中 22 IL_0007: ldc.i4.s 22 23 //把整数22弹出,并赋值给局部变量表中第1个位置的元素V_1 24 IL_0009: stloc.1 25 26 //以下代码完成C#中的输出操作 27 28 //取出局部变量表中V_1元素的值 "22" (copy)并压入计算栈中 29 IL_000a: ldloca.s V_1 30 //弹出刚刚压入的值("22")调用ToString方法转成string类型并将引用存入计算栈中 31 IL_000c: call instance string [mscorlib]System.Int32::ToString() 32 //取出局部变量表中第0个位置元素(V_0)的值("Zery")压入计算栈中(此时计算栈中有两个值,指向推管堆中"22"的引用地址和字符串"Zery") 33 IL_0011: ldloc.0 34 //弹出计算栈中两个值调用String的Concat方法把字个字符拼接存入托管堆中(Managed Heap )并返回地址压入计算栈中 35 IL_0012: call string [mscorlib]System.String::Concat(string,string) 36 //调用输出方法,调用输出方法后计算栈中的值(指向托管堆字符的地址)会被回收 。 37 IL_0017: call void [mscorlib]System.Console::WriteLine(string) 38 39 //未ToString的操作 40 IL_001c: nop 41 //取局部变量表中第1个位置的元素V_1的值("22") 压入计算栈中 42 IL_001d: ldloc.1 43 //把刚刚压入的整数22 装箱并返回指向托管堆的地址存入计算栈中 44 IL_001e: box [mscorlib]System.Int32 45 //取局部变量表中第0个位置的f元素V_0的值("Zery")并压入计算栈中 46 IL_0023: ldloc.0 47 //弹出计算栈中两个值调用String的Concat方法把字个字符拼接存入托管堆中(Managed Heap )并返回地址压入计算栈中 48 IL_0024: call string [mscorlib]System.String::Concat(object,object) 49 //调用输出方法 50 IL_0029: call void [mscorlib]System.Console::WriteLine(string) 51 IL_002e: nop 52 //标记返回 53 IL_002f: ret 54 } // end of method Program::Main
2.2 IL指令详解
.maxstack:计算栈(Evaluation Stack)可容纳数据项的最大个数
.locals init (int32 V_0,int32 V_1,int32 V_2):定义变量并存入Call Stack中的Record Frame中
nop:即No Operation 没有任何操作,我们也不用管它,
ldstr.:即Load String 把字符串加压入Evaluation Stack中
stloc.:把Evaluation Stack中的值弹出赋值到Call Stack中的Record Frame中
ldloc.:把Call Stack里的Record Frame中指定位置的值取出(copy)存入 Evaluation Stack中 以上两条指令为相互的操作stloc赋值,ldloc取值
call: 调用指定的方法
box:执行装箱操作
ret: 即return 标记返回
三 指令详解(深入介绍)
如果看代码中的注释你还不是很理解,那就看看下面的图解过程吧,如果每一步都画图,那工程太大了,所以我会把简单的的步组合成一张图并做上注释
先画初始化的代码详解图 注:为了减少图片所以栈的弹出与压入操作就省去了,都只画出了结果
IL_0001: ldstr "Zery"
IL_0006: stloc.0
IL_0007: ldc.i4.s 22
IL_0009: stloc.1
因为字符串是引用类型,所以是保存在托管堆中,而栈中只保存对字符引用的地址,可以看到图中的字符串是在托管中的,而计算栈中只保存了引用
IL_000a: ldloca.s V_1
IL_000c: call instance string [mscorlib]System.Int32::ToString()
IL_0011: ldloc.0
IL_0012: call string [mscorlib]System.String::Concat(string,string)
IL_0017: call void [mscorlib]System.Console::WriteLine(string)
IL_001d: ldloc.1
IL_001e: box [mscorlib]System.Int32
IL_0023: ldloc.0
IL_0024: call string [mscorlib]System.String::Concat(object,
object)
IL_0029: call void [mscorlib]System.Console::WriteLine(string)
装箱的过程图在上面已给出此处只把结果画出
四 总结
1 用两篇把 值类型与引用类型在内存中不同的位置与不同的操作详细的写了,我觉得还是很有必要的,因为所有的数据类型由这两种类型组成,把这两种类型的操作了解了
看其它IL指令就是透过本质看现象了。
2 关于画图,我觉得画图是程序员必学的知识,牛X的程序员画出来的,系统架构图,系统设计图等都是很有结构很清晰的。我的画图技能还有太多不足,只是画这种简单的图都觉得,无法完美的表达自己头脑所想的那样,
引用至 :http://www.cnblogs.com/zery/p/3376973.html