带着问题读CLR via C#(一)CLR的执行模型
Q1: 什么事CLR?
A1: CLR (Common Language Runtime) 是一个可以由多种编程语言使用的“运行时”。
Q2: CLR的核心功能有哪些?
A2: 1)内存管理;2)程序集加载;3)安全性;4)异常处理;5)线程同步
Q3: CLR与使用的编程语言有关吗?
A3: 无关。只要编译器是面向CLR的就行。
Q4: 选用不同编程语言经过面向CLR的编译器编译后生成的结果相同吗?
A4: 相同。无论选择什么语言,相应的编译器变异的结果都是一个托管模块,即一个标准的32位PE (Portable Executable) 32文件或64位PE32+文件。它们都需要CLR才能执行。
Q5: 托管模块的组成部分是什么,它们的作用分别是什么?
A5: 1)PE32或PE32+头;2)CLR头;3)元数据;4)中间语言
PE32头:1)标识了文件类型(GUI, CUI, DLL);2)包含一个文件生成时间的时间标记;3)包含与本地CPU代码有关的信息(在该模块包含CPU代码的情况下)。
CLR头:1)包含需要的CLR版本;2)托管模块入口方法的MethodDef元数据标记;3)模块的元数据,资源,强名称,一些标记以及不太重要的数据项的位置及大小。
元数据:1)包含描述源代码中定义的类型及成员的元数据表;2)包含描述源代码中引用的类型和成员。
中间语言:编译器编译源代码生成的代码,运行时会被CLR编译为本地CPU指令。
Q6: 什么是程序集?
A6: 程序集是一个抽象的概念,它是一个或多个模块/资源文件的逻辑分组,也是重用,安全性以及版本控制的最小单元。 生成的程序集既可以是一个可执行文件(exe)也可以是一个DLL.
Q7: 托管模块和程序集之间的关系是什么?
A7: 默认情况下,编译器实际会把生成的托管模块转换为程序集,程序集的清单中会指明该程序集仅有一个文件构成。如果项目中只有一个托管模块,没有资源文件或数据文件,那么程序集就是托管模块。如果想将多个文件合并到一个程序集,则需要使用其他工具来实现。
Q8: 方法执行的过程是什么?首次执行和之后执行有区别吗?
A8: 执行一个方法需要将程序集中的IL转换为本地CPU指令,这项工作由CLR的JIT(即时)编译器来完成。用如下例子讲解:
static void Main() { Console.WriteLine("Hello"); Console.WriteLine("GoodBye"); }
分析准备阶段:
1) CLR检测Main代码引用的所有类型,此例中为Console类型;
2) CLR分配一个内部数据结构,用于管理对引用的类型(即Console类型)的访问。Console类型中的所有方法在这个内部结构中都有一个入口, 通过该入口可以找到方法的具体实现;对该内部结构初始化时,CLR将每个方法的入口都设置成指向JITCompiler函数(CLR内部未文档化的一个函数);
执行阶段:
1) Main方法中首次调用WriteLine方法时,JITCompiler函数会被调用,这个函数知道调用的是哪个方法(WriteLine),以及什么类型(Console)调用了该方法;
2) JITCompiler在定义了该类型的程序集元数据中查找该方法(WriteLine)的IL,并对IL进行验证,若无误,则将该IL编译为本地CPU指令;
3) 将本地CPU指令保存至一个动态分配的内存块;
4) JITCompiler返回最初为Console类型创建的内部结构,找到WriteLine方法的入口,并将之前设置的指向JITCompiler的引用改为指向保存本地CPU指令的内存块;
5) JITCompiler回到保存本地CPU指令的内存块,并执行该指令。
当Console.WriteLine("Hello")执行结束后,继续执行下一行代码Console.WriteLine("Goodbye"),由于Console.WriteLine方法已经编译为本地CPU指令了,就会跳过JITCompiler函数的繁琐操作,直接执行本地CPU代码。但当应用程序终止后再次启动运行这段代码,JIT编译器必须重新将IL编译为本地CPU指令,因为之前是保存在内存块中的,程序终止后内存块会被清空。
Q9: IL有什么优势?
A9: IL可以提高应用程序的健壮性和安全性。在将IL编译为本地CPU指令时,CLR会执行验证过程,确保代码做的一切都是安全的(参数数量是否正确,参数类型是否正确,返回值是否被正确使用等等)。
Q10: 比较CLR, CTS和CLS.
A10: CLR是一个可以由多种编程语言使用的“运行时”, 它是围绕类型展开的,类型为应用程序和其他类型公开了功能,通过类型,可以用一种编程语言系的代码和另一种编程语言写的代码进行沟通,而CTS则是一个”通用类型系统”,它描述了类型的定义和行为。而由于CLR允许一种语言使用另一种语言定义的类型,但各种编程语言存在极大的区别,例如有些语言区分大小写而有些语言不区分,CLS是一个 ”公共语言规范”, 它定义了一个最小功能集,用一种语言定义了一种类型时,若想要其他语言可以使用该类型,就不要在该类型的public和protected成员中使用超出CLS的功能。每种编程语言都提供了CLR/CTS的一个子集以及CLS的一个超集。