字符串匹配算法——总结

1. 朴素算法:即暴力法

缺点在于,未能充分利用位移s所提供的信息。比如p=aaab,发现位移s=0是有效的。则位移1,2,3都不是有效位,因为T[4]=b。

时间复杂度:O((n-m+1)m)

2. rabin-karp

利用的是数论: 若a==b, 则 a≡b(mod q) ; 若a≠b(mod q), 则一定有a≠b

分别将P[m],T[s,s+m]转化成一个数值,再对值进行比较。如果不等,则一定有P[m] ≠ T[s,s+m];如果相等,则P[m]可能==T[s,s+m],再对P[m]和T[s,s+m]一一检测。

又因为Ts+1 可以直接从T推导出,所以算法复杂度降低。

算法分两步走:1.预处理:计算模式P和T[m]对应的数值。 时间复杂度为O(m)

                    2.匹配:时间复杂度O((n-m+1)m),因为每一个数都可能是有效位移。

但实际中,可能的有效位移很少,所以算法的期望匹配时间为O((n-m+1)+cm)=O(n+m)

 

3.字符串匹配自动机: 对于这个已弃疗。。。。。

4.KMP算法

 

分两步骤:1.预处理,计算模式P的前缀函数prefix[],复杂度O(m)

              2.检测匹配串,根据prefix[]来计算有效位移,复杂度O(n)

其中prefix[q] 是 模式Pq的 既是真前缀也是真后缀的字串 的 最长长度。 

算法代码如下:

 

 

5.BM算法

 将 坏字符的位移 和 最好后缀的 位移综合起来的。

算法待看。。。。。。原理想得不是很清楚

posted @ 2015-04-21 23:13  jasmine_turnsoul  阅读(374)  评论(0编辑  收藏  举报