经过分析:我的代码的主要时间花销在正则表达式的对单词的匹配上。 大概用了60%的时间。
其次时间主要用在排序上。这也是相当耗时间的事情。
如果要提高效率就要改为自动机来做。但是这要的可扩展性,和代码的维护性不如正则表达式的代码,正则表达式可以应对频繁变化的要求;