深入理解C# 3.x的新特性(1): Anonymous Type
一、Anonymous Type Overview
在传统的编程模式中,对象依赖于一个既定的Type,我们只能在Type的基础上创建相应的Instance。比如如果我们需要创建一个Employee Instance,前提是我们已经有了一个相应的Emplyee Type的定义。比如:
public class Employee
{
private Guid _id;
private string _name;
public Guid ID
{
get { return _id; }
set { _id = value; }
}
public string Name
{
get { return _name; }
set { _name = value; }
}
}
有了这样一个Employee Type,我们才可以创建相应的Employee Instance。
1: var v = new Employee{ ID = Guid.NewGuid(), Name = "Zhang San" };
注:在上面的Code中,实际上使用到了另外两个C# 3.0的new feature: Implicitly typed local variable & Object Initializer.
这样基于一个预先定义的Type的对象创建方式的一个最大的限制就是:对于我们需要创建的每一个对象,我们必先定于该对象对应的Type。Anonymous Type有效地解决了这个问题。我认为Anonymous Type主要是基于下面的目的而设计:
一个Type是对一个现实中实体的State(Data)和Behavior(Method)的抽象。对于一些仅仅只包含State(Data)的Type(这样对象通常作为Data Package在Application各个Layer之间、以及一个分布式环境中各个Application之间进行数据的传递),我们关心的仅仅是这个由这些数据成员组成结构:Type由哪些数据成员构成,它们的名称是什么,具有怎样的数据类型。换句话说,这样的Data-based Type定义了一个Data Structure,相应地,我们可以说一个固定的Data Structure对应着一个特定的Type。而C# 3.0 的Anonymous Type就提供了这样的实现:Compiler通过我们在Source Code定义的数据成员的具体结构为我们创建相应的Type。
比如我们现在需要一个在上面定义的Employee对象,实际上我们不是需要的一个Type Name叫做Employee的对象,而是需要一个具有如下特征的对象:该对象具有两个数据成员: ID & Name,他们的数据类型分别为GUID和string。在Source Code中,我们通过以下各结构指定这种特征:
我们仔细分析上面这段代码,实际上它包含两部分的信息的:
-
为Compiler Type的创建定义一个数据结构。{}中的内容指明了:包含两个数据成员,第一个是名称为ID,第二个为Name(成员的顺序也是一个决定因素,也就是说{ID = Name= "Zhang San" ,Guid.NewGuid()}和{ID = Guid.NewGuid(), Name= "Zhang San" }对于的Anonymous Type将是不同的。我不太清楚这样的设计到底处于一个什么样的目的);和Implicitly typed local variable一样,成员的类型由指定的数据或者表达式计算结果的数据类型决定。
-
为在运行时对象的创建提供数据,就像Constructor的参数一样。
二、CLR 眼中的Anonymous Type
我们说Anonymous Type仅仅是C# 3.0的新的特性,而没有说Anonymous Type是.NET Framework 3.5的新特性。这是因为Anonymous Type仅仅是.NET Programming Language和相应的Compiler的新引入的特征。而对于.NET Framework 3.5来说,它看不到这和原来有什么不同,换句话说,对于Anonymous Type和一般的Named Type,对于CLR来说他们之间没有什么本质的区别。对于下面这样的一段简单的代码:
1: var v = new{ID = Guid.NewGuid(), Name= "Zhang San" };
通过编译,Compiler将会创建一个名为<>f__AnonymousType0<<>j__AnonymousTypeTypeParameter1, <>j__AnonymousTypeTypeParameter2>的Class。该Class的结构如下:
1: public sealed class <>f__AnonymousType0<<>j__AnonymousTypeTypeParameter1, <>j__AnonymousTypeTypeParameter2>
2: {
3: public <>j__AnonymousTypeTypeParameter1ID{ get; set; }
4: public j__AnonymousTypeTypeParameter2 Name{ get; set; }
5: private j__AnonymousTypeTypeParameter1 <>i__AnonymousTypeField3;
6: private j__AnonymousTypeTypeParameter2 <>i__AnonymousTypeField4;
7: }
<>j__AnonymousTypeTypeParameter1和<>j__AnonymousTypeTypeParameter2这两个Generic Type代表我在 {} 中制定ID和Name的类型。通过这个结构,我们发现其定义和一般的Generic Type并没有什么区别。
为了进一步了解生成什么样的Anonymous Type,我们使用IL DASM在IL级别看看生成的Anonymous Type的大体结构:
为了做一个对比,下面是我们最开始定义的Named Employee Type在IL DASM中的结构:
如果想更清楚了解Anonymous Type的本质,建议读者亲自使用IL DASM看看的每个成员具体的IL。
三、Anonymous Type is Bound to Assembly
在上面一个部分中我们说了对于CLR来说,Anonymous Type和一般的Named Type并没有本质的区别。但是话不能太绝对,他们之间还是有一点小小的差异。到底是什么样差异,我在这里先卖一个关子。在具体介绍这个差异的时候,我们先来看看一个Sample:
在这个Sample中,我定义了两个Project:
-
Console Application:Artech.NewFeatureInCSharp.ConsoleApp
-
Class Libray:Artech.NewFeatureInCSharp.Library
Artech.NewFeatureInCSharp.Library中定一个Employee Type:
1: public class Employee
2: {
3: private Guid _id;
4: private string _name;
5:
6: public Guid ID
7: {
8: get { return _id; }
9: set { _id = value; }
10: }
11:
12: public string Name
13: {
14: get { return _name; }
15: set { _name = value; }
16: }
17: }
和一个Static的Utility Class:
1: public static class Utility
2: {
3: public static object Anonymous_GetEmployee(Guid id, string name)
4: {
5: return new { ID = id, Name = name };
6: }
7:
8: public static Employee GetEmployee(Guid id, string name)
9: {
10: return new Employee { ID = id, Name = name };
11: }
12: }
在Utility中定义了两个GetEmployee方法,分别返回以Anonymous Type形式和Named Type形式的Employee对象。
1: class Program
2: {
3: static void Main(string[] args)
4: {
5: var v1 = new { ID = Guid.NewGuid(), Name = "Zhang San" };
6: var v2 = new { ID = Guid.NewGuid(), Name = "Li Si" };
7: var v3 = Utility.Anonymous_GetEmployee(Guid.NewGuid(), "Wang Wu");
8: Console.WriteLine("var v1 = new{ID = Guid.NewGuid(), Name= \"Zhang San\" };");
9: Console.WriteLine("var v2 = new{ID = Guid.NewGuid(), Name= \"Li Si\" };");
10: Console.WriteLine("var v3 = Utility.Anonymous_GetEmployee(Guid.NewGuid(), \"Wang Wu\");");
11:
12: Console.WriteLine("\nv1.GetType() = {0}", v1.GetType());
13: Console.WriteLine("v2.GetType() = {0}", v2.GetType());
14: Console.WriteLine("v3.GetType() = {0}", v3.GetType());
15:
16: Console.WriteLine("\nobject.ReferenceEquals(v1.GetType(),v2.GetType()) = {0}", object.ReferenceEquals(v1.GetType(), v2.GetType()));
17: Console.WriteLine("object.ReferenceEquals(v1.GetType(),v3.GetType()) = {0}", object.ReferenceEquals(v1.GetType(), v3.GetType()));
18:
19: Console.WriteLine("\n\n");
20:
21: var v4 = new Employee { ID = Guid.NewGuid(), Name = "Zhang San" };
22: var v5 = new Employee { ID = Guid.NewGuid(), Name = "Li Si" };
23: var v6 = Utility.GetEmployee(Guid.NewGuid(), "Wang Wu");
24: Console.WriteLine("var v4 = new Employee{ID = Guid.NewGuid(), Name= \"Zhang San\" };");
25: Console.WriteLine("var v5 = new Employee{ID = Guid.NewGuid(), Name= \"Li Si\" };");
26: Console.WriteLine("var v6 = Utility.GetEmployee(Guid.NewGuid(), \"Wang Wu\");");
27:
28: Console.WriteLine("\nv4.GetType() = {0}", v4.GetType());
29: Console.WriteLine("v5.GetType() = {0}", v5.GetType());
30: Console.WriteLine("v6.GetType() = {0}", v6.GetType());
31:
32: Console.WriteLine("\nobject.ReferenceEquals(v4.GetType(),v5.GetType()) = {0}", object.ReferenceEquals(v4.GetType(), v5.GetType()));
33: Console.WriteLine("object.ReferenceEquals(v4.GetType(),v6.GetType()) = {0}", object.ReferenceEquals(v4.GetType(), v6.GetType()));
34: }
35: }
代码不复杂,我在这里简单介绍一下整体的结构。这个结构分两部分,第一部分是基于Anonymous Type的,另一部分是基于Named Employee Type的。在第一部分中,我首先创建了3个Anonymous Type的Instance:v1、v2和v3(v3是通过调用定义在Artech.NewFeatureInCSharp.Library中的Utility获得,其余两个则直接通过Inline的方式创建),第二部分也具有相同的代码结构。
1: var v1 = new{ID = Guid.NewGuid(), Name= "Zhang San" };
2: var v2 = new { ID = Guid.NewGuid(), Name = "Li Si"};
3: var v3 = Utility.Anonymous_GetEmployee(Guid.NewGuid(), "Wang Wu");
然后现实他们对应的Type的Full name.
1: Console.WriteLine("\nv1.GetType() = {0}", v1.GetType());
2: Console.WriteLine("v2.GetType() = {0}", v2.GetType());
3: Console.WriteLine("v3.GetType() = {0}", v3.GetType());
最后调用object.ReferenceEquals对这3个Type进行比较。
1: Console.WriteLine("\nobject.ReferenceEquals(v1.GetType(),v2.GetType()) = {0}",object.ReferenceEquals(v1.GetType(),v2.GetType()));
2: Console.WriteLine("object.ReferenceEquals(v1.GetType(),v3.GetType()) = {0}", object.ReferenceEquals(v1.GetType(), v3.GetType()));
大家先想想到底运行后将会出现什么样的结果,看看你的想法和真实的结果是否一致:
对于第二部分基于Named Type的输出,结果很明显,没有什么好说的。我们重点来看基于Anonymous Type的输出结果:
我们通过Inline的方式创建了v1和v2,通过调用定义在另一个Assembly中定义的Utility class创建了v3。虽然我们创建对象的方式不同,但是这3个Instance的结构完全相同,我们可以想象他们对应的Type应该相似。但是,他们到底是不是就是同一个Type呢?通过输出的Type的Full Name:<>f__AnonymousType0`2[System.Guid,System.String]来看,他们“貌似”同一个Type。但是Full name相同并不意味着他们就是同一个Type。确定两个Type的同一性的方法就是确定他们具有相同的Reference。于是我们使用了object.ReferenceEquals方法。两个调用的结果完全不同:v1和v2对应的Type是一样的,而v1和v3则不是同一个。关于Type在Managed Heap的体现,请参阅我的文章: 《[原创]What is "Type" in managed heap?》。
我们来讨论问什么会出现上面的运行结果。原因很简单:Compiler在生成Anonymous Type的时候,并不是为每个形如这样{M1=?, M2 =? , …}的结构生成一个不同的Type,它只会为不同的参数列表的结构:参数的名称,参数的数据类型,参数的相互顺序定义不同的Type。而具有相同的参数列表的{M1=?, M2 =? , …}会共享同一个Type。但是这种机制仅限于在同一个Assembly中。也就是在一个Assembly创建的Anonymous Type仅仅限于在本Assembly中使用,不同被另一个Assembly共享。所以我们通过Inline的方式创建了v1和v2是同一个Type的两个Instance,而我们通过跨Assembly创建的v3却属于不同的Type,尽管他们的Type定义可能完全一样。
深入理解C# 3.x的新特性(1):Anonymous Type
深入理解C# 3.x的新特性(2):Extension Method - Part I
深入理解C# 3.x的新特性(2):Extension Method - Part II
深入理解C# 3.x的新特性(3):从Delegate、Anonymous Method到Lambda Expression
深入理解C# 3.x的新特性(4):Automatically Implemented Property
深入理解C# 3.x的新特性(5):Object Initializer 和 Collection Initializer