KMP

KMP:

字符串的特征向量:由特征数组成的一维数组

字符串的特征数:在i位置上的首尾真子串能够匹配的最大长度。

e.g.字符串a b a c a b 对应的特征向量是001012

KMP的主要思想是在已经匹配的模式串子串中,找到最大的相同的前缀和后缀,移动是他们重叠。

e.g.    找到P=['a b a c a b']在S=['a b a c a a b a c a b a c a b a a b b']中的位置

def gen_pnext(p):
    """
    获取字符串s的特征向量
    """
    index, L = 0, len(p)
    pnext = [0] * L
    for i in range(1,L):
        k = pnext[i-1]
        while k | 0 and p[i] != p[k]:k = pnext[k - 1]
        if p[i] == p[k]:pnext[i] = k + 1
        else:pnext[i] = 0
    return pnext
def KMP_algorithm(s, p):
    '''
    KMP字符串匹配的主函数
    若存在字串返回字串在字符串中开始的位置下标,或者返回-1
    '''
    pnext = gen_pnext(p)
    print(pnext)
    n = len(s)
    m = len(p)
    i, j = 0, 0
    while i < n and j < m:
        if s[i] == p[j]:
            i += 1
            j += 1
        elif j != 0:
            j = pnext[j - 1]
        else:
            i += 1
    if j == m:
        return i - j
    else:
        return -1

 

posted @ 2019-09-08 10:40  天上白云蓝湛湛  阅读(213)  评论(0编辑  收藏  举报