《软件开发性能优化系列》之String操作
1、使用StringBuilder做字符串连接
string是不变类,使用+操作连接字符串会导致创建一个新的字符串。如果字符串连接次数不是固定的,例如在一个循环操作中,则应该使用StringBuilder类来做字符串连接工作。因为StringBuilder内部有一个StringBuffer,连接字符操作不会每次分配新的字符串空间。只有当连接后的字符串超出Buffer大小是,才会申请信的Buffer空间。典型代码如下:
StringBuiler sb = new StringBuilder(256);
for(int i = 0; i < str.Count; i++)
{
sb.Append(str[i]);
}
而如果连接字符数十固定的并且只有几次,此时应该直接用+号连接,保持程序简洁易读。实际上,编译器已经做了优化,会依据加号次数调用不同参数个数的String.Concat方法。例如:
String str = str1 + str2 + str3 + str4;
会被编译成:Sting.Concat(str1,str2,str3,str4).该方法内部会计算总的String长度,仅分配一次,并不会如通常想象的那样分配三次。作为一个值,当字符串连接操作达到10此以上时,则应该使用StringBuilder.
这里有个细节要注意:StringBuilder内部Buffer的缺省值为16,这个实在太小。按照StingBuilder的使用场景,Buffer肯定得重新分配。我建议使用256作为Buffer的初值。当然,如果能计算出最终生成字符串长度的话,则应该按这个值来设定Buffer的初值。我曾经开发过一个44位的UUID生成方法,仅仅把new StringBuilder()改为StringBuilder(44)前后就有3倍的效率差异。
2、避免不必要的调用ToUpper或ToLower方法
String是不变类,调用ToUpper或ToLower方法都会导致创建一个新字符串。如果被频繁调用,将导致频繁创建字符串对象。这违背了前面讲到的“避免频繁创建对象”这一基本原则。
例如,bool.Parse方法本身已经是忽略大小写的,但下面的代码每次访问IsNullable属性时,都要不必要的调用ToLower方法:
public virtual bool IsNullable
{
get
{
if(isSyncDictionary && this.DictionaryItem ! = null)
{
if(this.dictionaryItem.IsNullableValid)
{
return bool.Parse(dictionaryItem.IsNullable.ToString().ToLower());
}
}
}
}
另外一个非常铺平的场景是字符串比较,例如:
foreach (XmlNode node in DocumentElement.ChildNodes)
{
if (node is XmlElement)
{
if (node.Name.ToLower() == "appender")
{
Respoitory.AppenderLoader.Load(node);
}
else if (node.Name.ToLower() == "Render")
{
Respoitory.AppenderLoader.Load(node);
}
else if (node.Name.ToLower() == "Render")
{
Respoitory.RegisterUtilRunner.RunningRegisterUtil(node);
}
}
}
高效的做法是使用Compare方法,这个方法可以做大小写忽略的比较,并且不会创建新字符串:
if(String.Compare(node.Name,"appender",StringComparison.OrdinalIgnoreCase)==0)
最后列举的一个示例是使用HashTable的时候,有时候无法保证传递key的大小写是否符合预期,往往会把key强制转换到大小写方式,例如:myTalbe.Add(myKey.ToLower(),myObject).实际上HashTable有不同的构造方式,完全支持采用忽略大小写的Key:new HashTable(StringComparer.OrdinalIgnoreCase).
3、最快的空串比较方法
将String对象的Length属性与0比较式最快的方法:if(str.Length == 0)
其次是与sting.Empty常量或空串比较;if(str == String.Empty)或if(str == "")
注:C#在编译时会将程序集中声明的所有字符串常量放到保留池中(intern pool),相同常量不会重复分配。