从字符串中查找字符出现次数的方法和性能再比

    原文是Ninputer所发,名叫“从字符串中查找字符出现次数的方法和性能对比”。

    他在里面用了三种办法来查找'A'在"SADTHDGSAFSDGTGHRDGSADFADDRHDFSGASDAA"中的出现次数,可是我的测试结果的差别完全没有他的那么明显,三种方法最多也就相差2.5-2.7倍。也就是说遍历法和分割法只有不到3倍的效率差别,下面是上面那个字符串被三种方法测试1M遍的结果:
    1、遍历统计长度: 613ms
    2、替换后比较长度: 1,064ms
    3、断开字符串后计数: 1,611ms

    讨论后大家觉得一般情况下使用第二种方法是最经济的,因为少的代码会使程序的正确性得到提高,且在效率的损失也是可以接受的情况下。

    这里可以对第二个方法有个优化,把:
    c1 = str.Length - str.Replace("A", "").Length;
    改成:
    StringBuilder strb = new StringBuilder(str);
    c1 = str.Length - strb.Replace("A", "").Length;

    这次运行1M次的测试结果是:1,395ms,基本就是遍历法的两倍,而且我们还可以发现,这个方法的时间有1/3都是消耗在第一句建立StringBuilder上面,在这个的测试中它花费了578ms。

    结下来是讨论了一下把str的采样空间变大,我把str复制了20份,长度达到了740个字节,这下测试1M次的结果如下:
    1、遍历统计长度: 11,583ms
    2、替换后比较长度: 17,454ms
    3、断开字符串后计数: 26,953ms
    4、改进后的替换法比较: 18,625ms(其中12,518的时间消耗在StringBuilder的建立上)。

    可以看出StringBuilder里的native方法是效率极高的,再刨去其创建时的消耗后甚至高过了遍历法,可是StringBuilder的创建也是很费时间的,真是难以取舍呀。  

    测试环境:P4 2.4 512M WinXp .NET Framework 1.1.
    附测试代码:

test code

posted on 2004-12-15 23:09  birdshome  阅读(3499)  评论(5编辑  收藏  举报

导航