高效正则表达式 匹配优先与忽略优先?

考虑 ^.*: 与^.*?:  的区别:

1、前者从行头匹配到最后一个:  后者从行头匹配到第一个: 

2、注意:假设一行中有多个冒号,前者只能匹配一个,后者可以匹配多个。如果确定一行中最多只有一个冒号,使用二者是等价的。这里存在效率问题。

3、如果冒号靠近行的开头,使用后者,少吃就能匹配成功,如果使用前者,情况是多吃了很多,又都一个一个吐出来。同样道理,冒号靠近行的结尾,使用前者。

4、如果数据是随机的,一般使用量词优先匹配。

posted on 2015-04-12 17:34  Andy Niu  阅读(1129)  评论(0编辑  收藏  举报