clr 元数据
clr相关编译器编译生成的托管模块由四部分组成:PE32或32+头、clr头、元数据、IL代码。
元数据和IL代码完全对应,保持一致(:>)性。
元数据有很多用途:
VS的智能感知,自动补全;
代码验证保证类型安全;
序列化、反序列化;
垃圾回收(从元数据得知哪些根引用了对象)。
元数据包含两类表,一种描述源代码中定义的类型和成员;另一种描述代码引用的类型和成员。模块内部的一些元数据表的大小和偏移量在clr头中会有包含。
元数据是由几个表构成的二进制数据块。有三种表:定义表、引用表、清单表。
常用元数据定义表(定义于模块中的):
ModuleDef : 一个记录项。包含模块名、扩展名和模块版本ID(编译器创建的GUID);
TypeDef : 每个类型一个记录项。包含类型名称、基类型、一些标志(public,private等)以及一些索引(指向MethodDef表中该类型的方法、FieldDef表中该类型的字段、PropertyDef表中该类型的属性以及EventDef表中该类型的事件);
MethodDef : 每个方法一个记录项。包含方法的名称、一些标志(private,public,virtual,abstract,static,final等)、签名以及方法的IL代码在模块中的偏移量。每个记录项还引用了ParamDef表中的记录项;
FieldDef : 每个字段一个记录项。包含标志(public,private等)、类型和名称;
ParamDef : 每个参数一个记录项。包含标志(in,out,retval等)、类型和名称;
PropertyDef : 每个属性一个记录项。包含标志、类型和名称。
EventDef : 每个事件一个记录项。包含标志和名称。
ModuleDef {1}----------->{*} TypeDef {1}-----------------> | {*} MethodDef {1} ----------------->{*} ParamDef
| {*} FieldDef
| {*} PropertyDef
| {*} EventDef
常用引用源数据表:
AssemblyRef : 引用的每一个程序集有一个记录项。包含绑定该程序集所需的信息:程序集名称、版本号、语言文化以及公钥Token(根据发布者的公钥生成的一个小的哈希值,标识了所引用程序集的发布者)。另外还包含了一些标志以及一个被CLR忽略的但可以用于程序集的二进制数据的校验和的哈希值。
ModuleRef : 引用类型的实现的每个PE模块有一个记录项。包含模块名和扩展名。
TypeRef : 每个引用的类型有一个记录项。包含类型的名称和引用(指向类型的位置)。如果类型在另一个类型中实现,引用指向一个TypeRef记录项。如果类型在同一模块中实现,引用指向一个ModuleDef记录项。如果类型在调用程序集内的另一个模块中实现,引用指向一个ModuleRef记录项。如果类型在不同的程序集中实现,引用指向一个Assembly记录项;
MemberRef : 引用的每个成员(字段、方法、属性方法和事件方法)有一个记录项。包含成员的名称和签名,并指向对成员进行定义的类型的TypeRef记录项。
MemberRef------------->TypeRef-----------------> | TypeRef (在另一个类型中实现) ======>ModuleDef 或 ModuleRef 或 Assembly
| ModuleDef (在同一模块)
| ModuleRef (在同程序集的不同模块)
| Assembly (在不同程序集)
除此之外还有很多定义表和引用表。
清单表中主要包含作为程序集组成部分的那些文件的名称。此外,还描述了程序集的版本、语言文化、发布者、公开导出的类型以及构成程序集的所有文件。
CLR总是首先加载包含“清单”元数据表的文件,再根据“清单”来获取程序集中的其他文件。清单包含在PE文件中。
清单元数据表(程序集的):
AssemblyDef : 如果模块标识的是程序集,就包含单一记录项来列出程序集名称、版本、语言文化、一些标志、哈希算法以及发布者公钥(可为null);
FileDef : 每个PE文件和资源文件都有一个记录项(清单本身所在文件除外,该文件在AssemblyDef的单一记录项中列出)。包含文件名、扩展名、哈希值和一些标志。如果程序集只包含自己的文件,则该表无记录(VS中不能创建多文件程序集,只能通过命令行);
ManifestResourceDef : 每个资源文件一个记录项。包含资源名称、一些标志(是否外部可见:public,private)以及FileDef表的一个索引(指出包含在哪个文件中)。如果资源不是独立文件,那么资源是包含在PE文件中的流。嵌入资源,记录项会包含一个偏移量,指出资源流在PE文件中的起始位置;
ExportedTypesDef : PE模块中导出的每个public类型有一个记录项。包含类型名称、FileDef表的一个索引(指出类型由程序集的哪个文件实现)以及TypeDef表的一个索引。
AssemblyDef {1}-------------------->{*} FileDef {1}<----------------------------->{1} ManifestResourceDef
ExportedTypesDef {0,1}------------>{1} FileDef + {1} TypeDef