求一个字符串中连续出现次数最多的子串
题目:求一个字符串中连续出现的次数最多的子串。
例如,字符串“abababc”,最多连续出现的为ab,连续出现三次。
思路:
例如字符串“abababc”,最多连续出现的为ab,连续出现三次。要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。
两个题目的解法有些类似,都用到了后缀数组这个数据结构。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
abababc
bababc
ababc
babc
abc
bc
c
可以看出第1个后缀数组和第3个后缀数组的起始都为ab,第5个后缀数组也为ab。
可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。
下面是代码:
#include <iostream> #include <cstring> #include <utility> #include <string> #include <vector> using namespace std; pair<int, string> fun(const string& str) { vector<string> subs; int len = str.size(); for (int i = 0; i < len; i++) { subs.push_back(str.substr(i)); } int count = 1; int maxCount = 1; string sub; for (int i = 0; i < len; i++) { for (int j = i + 1; j < len; j++) { count = 1; if (subs[i].substr(0, j - i) == subs[j].substr(0, j - i)) { ++count; //j-i为子串长度 for (int k = j + j - i; k < len; k += j - i) { if (subs[i].substr(0, j - i) == subs[k].substr(0, j - i)) { ++count; } else { break; } } if (count > maxCount) { maxCount = count; sub = subs[i].substr(0, j - i); } } } } return make_pair(maxCount, sub); } int main() { string str; pair<int, string> rs; while (cin>>str) { rs = fun(str); cout<<rs.second<<":"<<rs.first<<endl; } return 0; }
另一种思路:
pair<int, string> fun(const string& str) { vector<string> subs; int len = str.size(); for (int i = 0; i < len; i++) { subs.push_back(str.substr(i)); } int count = 1; int maxCount = 1; string sub; //i为子串的长度 for (int i = 1; i < len; i++) { for (int j = 0; j + i < len; j += 1) { int k = j; count = 1; while (k + i < len && subs[k].substr(0, i) == subs[k + i].substr(0, i)) { ++count; k += i; } if (count > maxCount) { maxCount = count; sub = subs[j].substr(0, i); } } } return make_pair(maxCount, sub); }
参考:http://blog.csdn.net/foreverling/article/details/46883515