也谈用反射实现Enum→String映射:一种重视性能的方法2009-04-12 21:35一、问题的提出

也谈用反射实现Enum→String映射:一种重视性能的方法
2009-04-12 21:35
一、问题的提出

最近,博客园有许多blogger提出了为枚举显示中文名称的文章,例如[让枚举成员显示出中文信息],[利用自定义属性,定义枚举值的详细文本],[细节决定成败:映射枚举],[利用DescriptionAttribute定义枚举值的描述信息],还有原来看过的一些文章(不好意思地址没记)。这些文章的共同特点就是,使用了自定义Attribute附加在枚举值上, 在运行时获取枚举相关的信息。

这种方法中,由于是使用反射,因为有些人关心其中的性能问题——特别是处理大量数据的时候,例如将大量枚举导入到DataGrid的时候;而且人们也发现,Enum本身的ToString方法也使用了反射的方法,因此实际上也存在着速度慢的问题。本文试着以性能为重点,在不失去结构的易读性、可扩展性的条件下,基于以上各位高手的经验,给出一种重视性能的方法。

设计目标:

1,枚举定义形式上使用容易读写的附加Attribute的形式;
2,支持多语言版本,可以很容易地被本地化;
3,调用格式简单。

二、ToString()的性能问题
对于一个枚举值emItem,用下列代码进行测试:
for (int i = 0; i < 1000000; i )
{
s
= emItem.ToString();
}

其中s是String类型,emItem是一个MyEnum类型的枚举。
在我的机器上,该循环要花费4900毫秒左右。

当我把其中的“s = emItem.ToString();”换成“s = Enum.GetName(typeof(MyEnum), emItem);”之后,这个时间减少到2300毫秒。

但是必须注意的是,ToString方法和GetName的方法并不是相同的;但是有些时候对于我们来说也许用哪个都可以。
因此我的第一个建议就是,如果可以互换的话,使用GetName代替ToString。

三、 反射的性能问题
显然,上面的两个方法ToString和GetName,都不能解决显示枚举的自定义名,以及提供不同语言版本的问题。因此,很多人采用了反射的方法,像下面这样为每个枚举值增加了Attribute:
public enum MyEnum
{
[EnumItemDescription(
"Description1")]
EnumValue1
= 1,
[EnumItemDescription(
"Description2")]
EnumValue2
= 2,
[EnumItemDescription(
"Description3")]
EnumValue3
= 4,
}

其中,EnumItemDescriptionAttribute是类似于DescriptionAttribute的类。
这样做起来的确非常优雅;在读取该Attribute的值时,大多数使用的是如下的格式:
static string GetStringFromEnum(Enum enumvalue)
{
FieldInfo finfo
= enumvalue.GetType().GetField(enumvalue.ToString());
object[] cAttr = finfo.GetCustomAttributes(typeof(EnumItemDescriptionAttribute), true);
if (cAttr.Length > 0)
{
EnumItemDescriptionAttribute desc
= cAttr[0] as EnumItemDescriptionAttribute;
if (desc != null)
{
return desc.Description;
}
}
return enumvalue.ToString();
}

事实上,这已经是简化的模式——它没有进行循环。实际上看到的许多blogger的程序中,对所有的FieldInfo进行循环,逐一比较其名字,然后还要对每个FieldInfo的每个Attribute进行循环——也就是说,复杂度是O(n^2)。

那么,当我们用“s = GetStringFromEnum(emItem);”来进行我们进行的第一个实验时,结果是多少呢?

结果是,当我等到30秒的时候我终于不耐烦了;当我正想强行关闭它的时候,它结束了——32秒,即3万2千毫秒。

想想看,它慢也是当然的——每次将一个枚举值映射为字符串时,都要进行反射调用,而且每次还都要调用Enum.ToString这个本来就慢腾腾的家伙!


四、Dictionay Reflection的缓存式实现尝试
我们回头来想一想,我们为什么必须,或者说更喜欢在这里使用反射?
因为如果不用反射,我们就必须写一个像下面这样的映射函数:
static string StringFromEnum(MyEnum enumValue)
{
switch (enumValue)
{
case MyEnum.EnumValue1:
return "String1";
case MyEnum.EnumValue2:
return "String2";
case MyEnum.EnumValue3:
return "String3";
}
return enumValue.ToString();
}

(或者我们也可以用一个Dictionary<MyEnum, string>来维护)

也就是说,这样就把“枚举值”和“枚举值的名字”割裂开来了;从设计的角度来说,这样的确为以后的维护增加了困难;但是这样做的速度的确很快。

那么,我们如果把这二者结合起来,不就完美了吗?首先用反射读取所有的Attribute,然后将之存储到一个列表备用;以后每次调用时,不再进行反射调用,而是查询这个列表(相当于缓存)不就可以了吗?程序如下:

public class EnumMap
{
private Type internalEnumType;
private Dictionary<Enum, string> map;

public EnumMap(Type enumType)
{
if (!enumType.IsSubclassOf(typeof(Enum)))
{
throw new InvalidCastException();
}
internalEnumType
= enumType;
FieldInfo[] staticFiles
= enumType.GetFields(BindingFlags.Public | BindingFlags.Static);

map
= new Dictionary<Enum, string>(staticFiles.Length);

for (int i = 0; i < staticFiles.Length; i )
{
if (staticFiles[i].FieldType == enumType)
{
string description = "";
object[] attrs = staticFiles[i].GetCustomAttributes(typeof(EnumItemDescriptionAttribute), true);
description
= attrs.Length > 0 ?
((EnumItemDescriptionAttribute)attrs[
0]).Description :
//若没找到EnumItemDescription标记,则使用该枚举值的名字
description = staticFiles[i].Name;

map.Add((Enum)staticFiles[i].GetValue(enumType), description);
}
}
}

public string this[Enum item]
{
get
{
if (item.GetType() != internalEnumType)
{
throw new ArgumentException();
}
return map[item];
}
}
}

这样,我们只需要首先创建一个该类型的实例:
EnumMap myEnumMap = new EnumMap(typeof(MyEnum));
然后,在任何需要映射枚举值为字符串的地方,像这样调用:
s = myEnumMap[emItem];
就可以了。

那么,使用“s = myEnumMap[emItem];”进行最开始的哪个测试,结果如何呢?
结果是650毫秒——是不用“缓存”时耗费时间的50分之一。

这里我们注意到,直接提供EnumMap类可能会造成若干问题,而且对于每种枚举类型,我们都要为之新建一个EnumMap对象,比较麻烦;
因此我们对其进行如下简单封装,一方面保证其Singleton特性,一方面不用再去一个个创建EnumMap对象了。
posted @ 2010-09-27 09:54  肚肚  阅读(281)  评论(0编辑  收藏  举报