Length of the longest substring without repeating characters

给出一个字符串,找出这个字符串中最长连续的而且没有重复字符的子串,并返回它的长度。例如,对于字符串“BDEFGABEF”最长连续且没有重复字符的子串可以是“DEFGAB”或者“DEFGAB”,长度是6。对于字符串“BBBB”,它满足要求的字串的长度是1,即“B”。

首先分析一下,对于给定长度的字符串,它一共有多少个字串呢? 子串数 = 长度为1的子串数+长度为2的子串数+ 。。。+长度为n的子串数 = (n + 1) * n / 2
。 对于每个子串,在O(n)的时间内遍历它,看它是否有重复的字符出现。计算(n + 1) * n / 2个子串共需要花费的时间是O(n^3)。对于长度很长的字符串,这样的计算时间显然不行,下面介绍一种O(n)时间就可以搞定的算法。这个算法首先增加辅助空间,visited[256], 其中visited[i]表示ascii为i的字符出现的索引位置。因为索引都是从0开始的,所有把visited的所有值都初始化为0,接下来具体算法:

1,维护变量max_len表示满足要求的最大值,cur_len表示当前计算的没有重复字符的子串的长度,pre_index表示当前索引处的字符在之前出现过的位置,-1表示没有出现过。

2,对于每个当前遍历的字符,我们检查它在之前已经处理过的部分,也就是当前字符之前的所有字符中是否包含当前字符,如果没有出现过,那么我们就将cur_len++,以增加当前最长连续而且没有重复字符的子串的长度。

3,如果当前字符(即i索引处)的字符在之前出现过,出现的索引值是pre_index, 那么要做判断,判断pre_index处的字符是否在当前最长连续且没有重复字符串中,如果不在那么就将cur_len++,如果在的话那么就要首先判断max_len 与cur_len之间的关系,然后根据他们的关系来决定是否改变max_len,之后还得处理cur_len的值,因为已经出现了重复字符了,这样cur_len就得改变,改变成当前索引出的字符到pre_index处下一个字符位置差值,这样做,当前满足条件的子串才不会有重复的字符。

下面对上面的算法举个例子,GEEKSFORGEEKS:

1,

这个时候因为之前没有G,所以cur_len++,记录G出现位置。

2,


3,


之前E出现过,而且之前cur_len=2,所以得减去之前E出现的索引,用max_len记录遍历过的最大长度,之前max_len是0.

4,


5,


6,


7,


8,


9,


10,


剩下的大家有兴趣自己画图吧,下面给出代码:

 

#include<iostream>
#include<string>
using namespace std;

const int CH_NUM = 256;

int longest_non_repeat_str(const char* s) {
	int i;
	int pre_index = -1;
	int length = strlen(s);
	int max_len = 0;
	int cur_len = 1;
	int visited[CH_NUM] = {-1};
	visited[s[0]] = 0; // first char has been visited
	for (i = 1; i < length; i++) {
		pre_index = visited[s[i]];
		if (-1 == pre_index || i - cur_len > pre_index) {
			cur_len++;
		} else {
			if (cur_len > max_len)
				max_len = cur_len;
			cur_len = i - pre_index;
		}
		visited[s[i]] = i;
	}
	if (cur_len > max_len)
		max_len = cur_len;
	return max_len;
}

int main(int argc, char* argv[]) {
	char s[] = "geeksforgeeks";
	int rst = longest_non_repeat_str(s);
	cout << rst << endl;
	cin.get();
	return 0;
}


 

 

posted @ 2013-06-07 20:02  jlins  阅读(187)  评论(0编辑  收藏  举报