KMP算法
头文件 string 与string.h的区别
一般来说,没有后缀的头文件是C++的标准头文件;有后缀.h的是C的标准头文件。C标准头文件可以去后缀加前缀 c 来转换为C++的头文件来使用。
如:iostream是标准的C++的头文件,iostream.h是C的头文件
C中iosteam.h里面定义的所有类以及所有的对象都是在全局空间里,所以一般可以直接使用;
而C++的iostream头文件中的对象定义在名字空间std中,所以一般使用该头文件的类型时,需加命名空间std。
但唯有 string 与 string.h是个特例。
因为C++要兼容C标准库,而C标准库中有一个string.h的文件表示对C中字符串的处理函数,如strcat,在C++中可用cstring表示C标准的string.h,从而来使用C标准中的字符串处理函数。
而C++中定义的string头文件则表示string的类,定义于名字空间std中,两者根本是两个含义不同的头文件。
对于C++中的string类,如果其中存放的是C标准字符串,会在string类的尾部用 \0 标记,这样使得 c_str() 函数的性能高效(c_str()返回的是指向 const char* 的指针,需要使用\0标记);但该 \0 没有算入string类的size()与length()函数中。
如,string a("abcd");
_Ptr所指向的内容中含有 '\0' ,但 a.size() = a.length() = 4;
string s1("\0\0\0"); //s1.size() = 0;s1.lenth() = 0,c风格的字符串,以\0结尾,就算加1000个有意义的字符在后面,
都会被忽略掉因此这种 方式调用构造函数,就是以空串初始化string了
string s2(3,'\0'); // s2.size() = 3;s2.length()=3, 申请3个字节的空间,再push_back三个字符,
任意char都可以压入,和终止符非终止符没任何关系
1.朴素的模式匹配算法
主串与字串(模式串)不断的回溯
若字符串以1标为起始位置,则 j 回溯至1,而 i 回溯至 i - (j-1) +1 = i-j+2处
2.KMP算法
其实由上图可知,对应相同颜色的元素相等。其实没有必要 i,j 都回溯 ,只需要 j一个元素回溯即可,而 j 回溯的位置由 next[j]决定。
即 j = next[j];
而next[j]的大小只与模式串有关,与主串没有关系。
具体来说,设模式串为 T[1,...,m]
next[j] 等于 字串T[j]中 最大相同前缀和后缀的个数+1。
求next[j]算法:
求kmp与next思想基本一致。
kmp代码参考:
kmp代码