C#字符串与享元(Flyweight)模式
写这个文章,主要是因为网上对C#字符串和享元模式的误解比较多。
Flyweight模式
先说这名字,fly呢,就是苍蝇,没错这里面不是飞的意思,是苍蝇的意思,weight大家都知道,就是重量,苍蝇的重量,就是非常非常轻的意思。所以Flyweight模式就是处理非常非常轻量级对象的一个东西。
Flyweight的目标是解决大量细粒度对象的内存消耗问题,当然,巧妇难为无米之炊,任何模式和手法都不能凭空造出内存来,所以享元模式针对的情况是这些细粒度对象的中数据有重复的情况。
Flyweight的做法是,把对象的状态(通常用属性表示),分成两个部分,一部分是内部状态,另一部分是外部状态。内部状态外部状态是不易重复的(或者说必要的),外部状态
内部状态是易重复的。所以,Flyweight把外部状态提取出来共享,这样就一定程度解决了内存占用问题。
C#中的字符串不是Flyweight模式
在网上常常可以看到一个说法,说C#中的字符串使用了Flyweight模式,开门见山地说,这个说法是错误的。
错在哪里呢?按照上文的介绍,错就错在字符串它没有所谓的“内部状态外部状态”。
通常讲字符串是享元的原因就是以下代码:
string a = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a, "Hello World")); //True
当使用字符串直接量的时候,不论你写了多少个"Hello World",最终内存里面只有一个字符串对象。
运行时创建的字符串并不在此列,可以使些手段,强制在内存里面产生新的字符串。
string a = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a, new String("Hello World".ToCharArray()))); //False
因为我们强行调用了new,所以这个字符串跟内存中的直接量"Hello World"对应的对象不是同一个。
有趣的是,C#还允许强制把一个字符串加入到(如果已经有了,就只是找出来)字符串池里面。
string a = "Hello World";
string b = String.Intern(new String("Hello World".ToCharArray()));
Console.WriteLine(Object.ReferenceEquals(a,b) );
或者
string a = String.Intern(new String("Hello World".ToCharArray()));
string b = String.Intern(new String("Hello World".ToCharArray()));
Console.WriteLine(Object.ReferenceEquals(a,b) );
前面提到了,这个行为跟Flyweight使用的内部状态和外部状态不同,是两个对象实实在在就是同一个对象。
C#中的字符串与Flyweight模式
好吧,前面说了不少,C#中的字符串不是Flyweight模式,但是是不是就意味着C#里面字符串跟Flyweight没有关系呢?
当然不是,否则我写这么一篇文章岂不是太蛋疼了……
字符串池和Intern方法简直是实现Flyweight的神器啊!
考虑我们有某一类对象,可能会创建几百万个,对象里面恰巧有这么一个属性叫做颜色,它在对象构造的时候随机产生,颜色用的是rgb色,用rgb24来表示,于是颜色字符串类似#ccc这样子。
代码写起来就像下面的样子:
class Element { static Random rnd = new Random(); static char[] table; static Element() { table = "0123456789abcdef".ToCharArray(); } public string color; public Element() { color = "" + table[rnd.Next() % 16] + table[rnd.Next() % 16] + table[rnd.Next() % 16]; } }
接下来我们创建3千万个对象看看如何
Element[] eles = new Element[30000000]; for (var i = 0; i < 30000000; i++) { eles[i] = new Element(); }
从任务管理器看到一大块内存被吃掉了
接下来我们使用String.Intern来实现Flyweight:
class Element { static Random rnd = new Random(); static char[] table; static Element() { table = "0123456789abcdef".ToCharArray(); } public string color; public Element() { color = String.Intern("" + table[rnd.Next() % 16] + table[rnd.Next() % 16] + table[rnd.Next() % 16]); } }
同样来看看运行结果:
可以看到内存占用量的明显变化。
因为字符串对象的不可更改性质,使用了String.Intern之后,我们完全看不出前后color的区别,也就是说,修改前后的Element类是完全等效的,但是Flyweight为我们节约了大量的内存。
更多思考
这个典型的使用flyweight场景为我们揭示了享元外部状态内部状态的特征:像字符串一样不可更改的对象。GoF原书的例子中的字型对象Glyph也是如此。
String.Intern这种对象池的方式实现flyweight也值得借鉴,我们可以考虑自己设计flyweight的外部状态对象时使用类似的方式。