• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
ying_vincent
博客园    首页    新随笔    联系   管理    订阅  订阅

Algorithm: pattern searching

kmp算法:用一个数组保存了上一个需要开始搜索的index,比如AAACAAA就是0, 1, 2, 0, 1, 2, 3, ABCABC就是0, 0, 0, 1, 2, 3,复杂度O(M+N)

 1 #include <iostream>
 2 #include <map>
 3 #include <vector>
 4 #include <algorithm>
 5 #include <string>
 6 
 7 using namespace std;
 8 
 9 int main()
10 {
11     string pattern = "ABCABC";
12     string s = "ABCABCABCABCBCABC";
13     vector<int> lps(pattern.size());
14     int len = 0;
15     int i = 1;
16     lps[0] = 0;
17     while (i < pattern.size()) {
18         if (pattern[i] == pattern[len]) {
19             len++;
20             lps[i] = len;
21             i++;
22         }
23         else if (len != 0) len = lps[len-1];
24         else {
25             lps[i] = 0;
26             i++;
27         }
28     }
29     //for (int i = 0; i < pattern.size(); i++) cout << lps[i] << endl;
30     i = 0;
31     int j = 0;
32     while (i < s.size()) {
33         if (s[i] == pattern[j]) {
34             j++;
35             i++;
36         }
37         if (j == pattern.size()) {
38             cout << i - j << endl;
39             j = lps[j-1];
40         }
41         else if (pattern[j] != s[i]) {
42             if (j != 0) j = lps[j-1];
43             else i++;
44         }
45     }
46     return 0;
47 }

 robin-karp算法,给pattern做hash-value,给s前pattern.size()的子串也做hash-value,如果相同则输出当前位置,如果不相同则去掉这个子串的第一个,加上新进来的那个字符。复杂度最好是O(M+N),最差O(M*N)。

http://www.geeksforgeeks.org/searching-for-patterns-set-3-rabin-karp-algorithm/

 FA算法:http://www.geeksforgeeks.org/searching-for-patterns-set-5-finite-automata/

 Boyer Moore Algorithm - bad character heuristic: 记录各个字母在pattern最后出现的位置,从后往前比较,如果不匹配,就向前移动s当前字母在pattern的位置与当前匹配到的位置的差值,如果这个位置在当前位置后,则只能往前移一个。复杂度最好是O(N/M),最坏是O(N*M)。

http://www.geeksforgeeks.org/pattern-searching-set-7-boyer-moore-algorithm-bad-character-heuristic/

 

posted @ 2014-02-20 06:12  ying_vincent  阅读(326)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3