KMP
KMP:
字符串的特征向量:由特征数组成的一维数组
字符串的特征数:在i位置上的首尾真子串能够匹配的最大长度。
e.g.字符串a b a c a b 对应的特征向量是001012
KMP的主要思想是在已经匹配的模式串子串中,找到最大的相同的前缀和后缀,移动是他们重叠。
e.g. 找到P=['a b a c a b']在S=['a b a c a a b a c a b a c a b a a b b']中的位置
def gen_pnext(p): """ 获取字符串s的特征向量 """ index, L = 0, len(p) pnext = [0] * L for i in range(1,L): k = pnext[i-1] while k | 0 and p[i] != p[k]:k = pnext[k - 1] if p[i] == p[k]:pnext[i] = k + 1 else:pnext[i] = 0 return pnext
def KMP_algorithm(s, p): ''' KMP字符串匹配的主函数 若存在字串返回字串在字符串中开始的位置下标,或者返回-1 ''' pnext = gen_pnext(p) print(pnext) n = len(s) m = len(p) i, j = 0, 0 while i < n and j < m: if s[i] == p[j]: i += 1 j += 1 elif j != 0: j = pnext[j - 1] else: i += 1 if j == m: return i - j else: return -1