KMP算法

头文件 string 与string.h的区别

一般来说,没有后缀的头文件是C++的标准头文件;有后缀.h的是C的标准头文件。C标准头文件可以去后缀加前缀 c 来转换为C++的头文件来使用。

如:iostream是标准的C++的头文件,iostream.h是C的头文件

C中iosteam.h里面定义的所有类以及所有的对象都是在全局空间里,所以一般可以直接使用;

而C++的iostream头文件中的对象定义在名字空间std中,所以一般使用该头文件的类型时,需加命名空间std。

但唯有 string 与 string.h是个特例。

因为C++要兼容C标准库,而C标准库中有一个string.h的文件表示对C中字符串的处理函数,如strcat,在C++中可用cstring表示C标准的string.h,从而来使用C标准中的字符串处理函数。

而C++中定义的string头文件则表示string的类,定义于名字空间std中,两者根本是两个含义不同的头文件。

参见:string与string.h的区别

 

对于C++中的string类,如果其中存放的是C标准字符串,会在string类的尾部用 \0 标记,这样使得 c_str() 函数的性能高效(c_str()返回的是指向 const char* 的指针,需要使用\0标记);但该 \0 没有算入string类的size()与length()函数中。

如,string a("abcd");

image

image

_Ptr所指向的内容中含有 '\0' ,但 a.size() = a.length() = 4;

string s1("\0\0\0");  //s1.size() = 0;s1.lenth() = 0,c风格的字符串,以\0结尾,就算加1000个有意义的字符在后面,

                                       都会被忽略掉因此这种  方式调用构造函数,就是以空串初始化string了

image

string s2(3,'\0');  // s2.size() = 3;s2.length()=3, 申请3个字节的空间,再push_back三个字符,

                                           任意char都可以压入,和终止符非终止符没任何关系

image

1.朴素的模式匹配算法

主串与字串(模式串)不断的回溯

 

 

image

若字符串以1标为起始位置,则 j 回溯至1,而 i 回溯至 i - (j-1) +1 = i-j+2处

2.KMP算法

其实由上图可知,对应相同颜色的元素相等。其实没有必要 i,j 都回溯 ,只需要 j一个元素回溯即可,而 j 回溯的位置由 next[j]决定。

j = next[j];

而next[j]的大小只与模式串有关,与主串没有关系。

具体来说,设模式串为 T[1,...,m]

next[j] 等于 字串T[j]中 最大相同前缀和后缀的个数+1。

image

 

 

image

image

next[j]算法

image   image

求kmp与next思想基本一致。
kmp代码参考:
kmp代码
posted @ 2013-04-13 11:08  winko  阅读(338)  评论(2编辑  收藏  举报