寻找最长的不含有重复字符的子串

可能看标题不会明白这个题到底什么意思,来看看下面的例子:

 

abcabcbb  ➡  abc ➡  3

bbbb  ➡  b  ➡  1

pwwkew  ➡  wke ➡  3

看了栗子是不是明白了呢?

其实需求很简单,实现的方法也很多,不过在这里我要来写一种效率最高的算法,只需要一次循环就可解决:

function findNoRepeatMaxLenStr (str) {

      let lastPositions = {}

      let start = 0

      let maxLen = 0

    

      for (let i=0; i<str.length; i++) {

            const s = str[i]

            if (lastPositions[s] !== 'undefined' && lastPositions[s] >= start) {

                  start = lastPositions[s] + 1

            }

            if (i - start + 1 > maxLen) {

                  maxLen = i - start + 1

            }

        lastPositions[s] = i

      }

      return maxLen

}

 

// test

console.log(findNoRepeatMaxLenStr('abcabcbb'))  // 3

那么看完代码,请自己先胡思乱想一下,能看得懂不?

行了,看到这我就知道你没看懂,那么来解释一下吧。

思路是这样的,假如下面的图形是一个字符串,每个格子代表一个字符:

此时咱们开始使用 for 循环扫描整个字符串,当扫描到 x(x 代表任意位置的任意的字符串)的时候,那么咱们应该怎么做呢?

首先要记录一个 start 起始位置,当然一开始就是 0 了,那么 start 在循环中不仅仅只是表示字符串从 0 开始,还表示当前不含有最长重复子串的开始,那么咱们要做的事情就一件:保证从 start 到 x 之间没有重复的字符串,再说的通俗点就是看检查 start 到 x 之间有没有重复的 x 。

那么怎么做到检查这个动作呢?

这个时候 lastPositions 就派上用场了。当循环到 x 的时候,记录一下这个 x 最后一次出现的位置在哪里。

那么记录完毕之后,当进行检查 start 到 x 之间 是否有重复的 x 的时候,咱们就去问 lastPositions[x],此时会有2种情况:

  • 第一种情况是 x 从来没有出现过或者出现在了 start 之前;

  • 第二种情况是 x 出现在 start 到 x 中间。

那么对于第一种情况,咱们不用去管。而第二种情况自然是不满足条件的情况了,此时,咱们就要更新 lastPositions[x],将这个 x 的位置更新为 lastPositions[x] + 1。

 

总结下来就是:

  • lastPositions[x] 不存在或 < start  满足条件,无需操作

  • lastPositions[x] 存在并且 >= start  不满足条件,更新 lastPositions[x]++

那么在结合上面的代码,逻辑就清晰了,唯一有些绕圈圈的地方就是第二个 if 中的 +1 操作,原因就是字符串的索引是从 0 开始的,那么假如第一个为 x 满足条件,实际索引是0,那么长度应该是 0 + 1 = 1。

 

最后,这道算法题的出处来自:

  • https://leetcode.com/problems/longest-substring-without-repeating-characters/description/

  • 里面有各种各样的实现方法,可以作为参考。