《CLR Via C#》学习笔记系列12- 类型、对象、线程栈和托管堆在运行时的关系
我们将讨论类型、对象、线程栈和托管堆在运行时的相互关系,假定有以下两个类定义:
internal class Employee
{
public int GetYearsEmployed()
{
return 1;
}
public virtual string GetProgressReport()
{
return "zhengwei";
}
public static Employee Lookup(string name)
{
Employee e = new Manager();
return e;
}
}
internal sealed class Manager : Employee
{
public override string GetProgressReport()
{
return "overrid zhengwei";
}
}
Windows 进程已启动,CLR已加载到其中,托管堆已初始化,而且已创建一个线程(连同它的1MB栈空间)。线程已执行了一些代码,马上就要调用M3方法。图1展示了目前的状态。Main方法包含的代码演示了CLR是如何工作的。
JIT编译器将Main的IL代码转换成本机的CPU指令,会注意到Main内部引用的所有类型,包括Employee,Int32,Manager以及String。 这时CLR要确认定义了这些类型的所有程序集都已加载。然后,利用程序集的元数据,CLR提取与这些类型有关的信息,
创建一些数据结构来表示类型本身。图2展示了为Employee和Manager类型对象使用的数据结构。由于线程在调用Main前已执行了一些代码,所以Int32和string类型对象已经创建好了,图中没有显示它们。
现在我们讨论一一这些类型对象,我们在堆上创建的对象都包含两个额外的成员:类型对象指针和同步块索引。图2中Employee和Manager类型对象都有这两个成员。定义类型时,可在类型内部定义静态数据字段。为这些静态数据字段提供支援的字节在类型对象自身中分配。每个类型对象最后都包含一个方法表。在方法表中。类型定义的每个方法都有对应的记录项。由于Employee定义了3个方法,所以有3个记录项。Manager类型只定义了1个方法,所以Manager的方法表只有1个记录项。
当CLR确认方法需要的所有类型对象都已创建,Main的代码已经编译之后,就允许线程执行Main的本机代码。Main代码执行时必须在线程栈中为局部变量分配内存,如图3 所示CLR自动将所有局部变量初始化为NULL或0,然而,如果代码试图访问尚未显式初始化的局部变量,C#会报错。
然后,Main执行代码构造一个Manager对象。这造成在托管堆创建Manager类型的一个实例,如图4所示,可以看出,和所有对象一样,Manager对象也有类型对象指针和同步块索引。该对象还包含必要的字节来容纳Manager类型定义的所有实例数据字段,以及容纳由Manager的任何基类(本例就是Employee和Object)定义的所有实例字段。任何时候在堆上新建对象,CLR都自动初始化内部的“类型对象指针”成员来引用和对象对应的类型对象(本例就是Manager类型对象)。此外,在调用类型的构造器之前,CLR会先初始化同步块索引,并将对象的所有实例字段设为null或0。new 操作符返回Manager对象的内存地址,该地址保存到变量e中(e在线程栈上)。
Main的下一行代码调用Employee的静态方法Lookup。调用静态方法时,CLR会定位与定义静态方法的类型对应的类型对象。然后,JIT编译器在类型对象的方法表中查找与初调用方法对应的记录项,对方法进行JIT编译,再调用JIT编译好的代码。本例假定Employee的Lookup方法要查询数据库来查找joe,再假定数据库指出的joe是公司的一名经理,所以在内部,Lookup方法在堆上构造一个新的Manager对象,用joe的信息初始化它,返回该对象的地址。该地址保存到局部变量e 中。这个操作的结果如图5.
注意,e不再引用第一个Manager对象。事实上,由于没有变量引用该对象,所以它是未来垃圾回收的主要目标。垃圾回收机制将自动回收该对象占用的内存。
Main调用Employee的非虚实例方法GetYearsEmployed。调用非虚实例方法时,JIT编译器会找到与“发出调用的那个变量(e)的类型(Employee)”对应的类型对象(Employee类型对象)。这时变量e初定义成一个Employee。如果Employee类型没有定义正在调用的那个方法,JIT编译器会回溯类层次结构(一直回溯至Object),并在沿途的每个类型中查找该方法。之所以能这样回溯,是因为每个类型对象都有一个字段引用了它的基类型,这个信息在图中没有显示。
然后,JIT编译器在类型对象的方法表中查找引用了被调用方法的记录项,对方法进行JIT编译,再调用JIT编译好的代码。本例假定Employee的GetYearsEmployed方法返回1。这个整数保存到局部变量year中。如图6所示。
Main调用Employee的虚实例方法GetProgressReport。调用虚实例方法时,JIT编译器要在方法中生成一些额外的代码。方法每次调用都会执行这些代码。这些代码首先检查发出调用的变量,并跟随地址来到发出调用的对象,然后,代码检查对象的内部的“类型对象批针成员”,该成员指向对象的实际类型。然后代码在类型对象的方法表中查找引用了被调用方法的记录项,对方法进行JIT编译,再调用JIT编译好的代码。由于目前e引用一个Manager对象,所以会调用Manager的GetProgressReport实现。
至此,我们已经讨论了源代码、IL和JIT编译的代码之间的关系。还讨论了线程栈、实参、局部变量以及这些实参和变量如何引用托管堆上的对象。还知道对象含有一个指针指向对象的类型对象(类型对象中包含静态字段和方法表)。还讨论了JIT编译器如何决定静态方法、非虚实例方法以及实例方法的调用方式。理解这一切之后,可以深刻地认识CLR的工作方式。以后在建构、设计和实现类型、组件以及应用程序时,这些知识会带来帮助。
下面,我们将深入控计一下CLR内部发生的事情。
注意Employee和Manager类型对象都包含“类型对象指针”成员。这是由于类型对象本质上也是对象。CLR创建类型对象时,必须初始化这些成员。初始化成什么呢?你肯定会这样问。CLR开始在一个进程中运行时,会立即为MSCorLib.dll中定义的System.Type类型创建一个特殊的类型对象。Employee和Manager类型对象都是该类型的“实例”。因此,它们的类型对象指针成员会初始化成对System.Type类型对象的引用。如图7所示
当然,System.Type类型对象本身也是对象,内部也有“类型对象指针”成员。这个指针指向什么?它指向本身,因为System.Type类型对象本身是一个类型对象的“实例”。现在,我们总算理解了CLR的整个类型系统及其工作方式。
顺便说一句,System.Object的GetType方法返回存储指定对象的“类型对象指针”成员中的地址。也就是说,GetType方法返回指向对象的类型对象指针。这样就可判断系统中任何对象的真实类型。