yaoyi

[python]关于字符串查找和re正则表达式的效率对比

最近需要在python中做大日志文件中做正则匹配

开始直接在for in 中每行做re.findall,后来发现,性能不行,就在re前面做一个基本的字符串包含判断 (str in str),如果不包含直接continue

效率对比:

1、只做一次包含判断:

real 0m13.740s
user 0m12.683s
sys 0m1.046s

 

2、做两次包含判断:

real 0m9.226s
user 0m8.134s
sys 0m1.069s

 

3、不做包含判断:

real 0m25.205s
user 0m24.165s
sys 0m1.021s

 

样本日志1G

 

posted on 2017-04-22 15:49  yaoyi  阅读(1057)  评论(0编辑  收藏  举报

导航