Excaliburer`s Zone

It was challenging, but not risky.

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

一.题目链接:https://leetcode.com/problems/longest-substring-without-repeating-characters

二.题目大意:

  给定一个字符串,返回它最长的无重复的子串的长度。

三.题解

  该题目,我用了三种方法:

1.思路一:暴力解决,直接用两层for循环对目标字符串所有的子串进行判断。代码如下:

class Solution {
public:
    int lengthOfLongestSubstring(string s) {
        int len = s.length();
        string str;//表示最长子串
        int max_len = 0;
        for(int i = 0; i < len; i++)
        {
            string t_str;//中间变量;
            for(int j = i ; j < len; j++)
            {
                t_str = t_str + s[j];
                if(isUnique(t_str) == 1)
                {
                    if(t_str.length() > max_len)
                     max_len = t_str.length();
                }
                else
                    break;
            }
        }
        return max_len;

    }
    //判断字符串是否包含重复元素(利用了哈希表,所以时间复杂度为O(n))
    int isUnique(string s)
    {
       int len = s.length();
       unordered_map<char,int> _map;
       unordered_map<char,int>::iterator it;
       for(int i = 0 ; i < len; i++)
       {
           it = _map.find(s[i]);
           if(it == _map.end())
            _map.insert(pair<char,int>(s[i],1));
           else
            return 0;
       }
       return 1;
    }
};

  isUnique()用于判断字符串是否包含重复的元素,由于用的是unordered_map(由哈希表实现,时间复杂度为O(1)),该函数的时间复杂度的为O(n);lengthOfLongestSubstring(string s)方法的时间复杂度为O(n2),故总的时间复杂度为O(n3),空间复杂度为O(n)。

提交结果:超时!

2.对方法一进行改,发现子串判断是否包含重复元素的过程可以在遍历过程中实现,所以就没必要单独定义一个方法了。代码如下:

class Solution {
public:
    int lengthOfLongestSubstring(string s) {
        int len = s.length();
        string str;//表示最长子串
        int max_len = 0;
        for(int i = 0; i < len; i++)
        {
            string t_str;//中间变量;
            unordered_map<char,int> _map;
            unordered_map<char,int>::iterator it;
            for(int j = i ; j < len; j++)
            {
                it = _map.find(s[j]);
                if(it == _map.end())
                {
                     t_str = t_str + s[j];
                    _map.insert(pair<char,int>(s[j],1));
                    if(t_str.length() > max_len)
                     max_len = t_str.length();
                }
                else
                    break;
            }
        }
        return max_len;

    }
};

  这种方法,把unordered_map查询和插入的过程融合到for循环中,总的时间复杂度为O(n2),相比方法一时间上缩小了一个数量级。

提交结果:Accepted,耗时786ms.

3.看提交结果只打败了0.02%cpp提交。还可不可以再进行改进呢?

思路三:对于一个字符串,例如qpxrjxkltzyx,我们从头开始遍历时,如果遇到一个之前出现过的字符的话,例如:qpxrjx,那么从第一个x到第二个x的这段子串,一定不包含在我们的最终结果之中,我们需要记录的子串为:qpxrj;而且下一次的起始位置是第一个x之后的那个位置;这样指导最后一个字符;这实质可以看成一种贪心(子问题的性质决定了父问题的性质)。如图所示:

代码如下:

class Solution {
public:
    int lengthOfLongestSubstring(string s) {
        vector<int>dict(256,-1);//此处的vector相当于一个哈希表
        int max_len = 0;
        int len = s.size();//string的size()方法和length()方法内部实现其实完全一样,只不过容器都有size()方法,此处是为了满足不同人的习惯
        int start = -1;//起始位置
        for(int i = 0; i < len; i++)
        {   //遇到重复出现的字符,则start的位置变成重复的那个字符之前出现的位置
            if(dict[s[i]] > start)
               start = dict[s[i]];//本来start应该为dict[s[i]]+1的,但后面计算长度时,还需在加个1,相当于i-start+1,所以1相当于抵消了
           max_len = max(max_len, i - start);//每次迭代长度都更新
           dict[s[i]] = i;
        }
        return max_len;

    }
};

  需要注意的点都在注释中说明了,尤其需要注意的是start的赋值此处为了简便,把1去掉了;每次迭代长度更新相当于记录了当前子串的最大长度。此外start的初始值为-1,因为位置0处的字符也要考虑。i一直是增加的,只是start的位置在变化。

该算法的时间复杂度为O(n),空间复杂度为O(1),相比方法2,时间又缩短了一个数量级。

提交结果:Accepted,耗时18ms.

4.此外,如果本题要求的结果是最长无重复子串的话怎么办?可以设置两个标记s和e,用于记录每次更新max_len的i和start,最终的子串即以位置s开以位置e结尾的子串。

5.《剑指offer(第二版)》面试题48,给出了利用动态规划的思想求解,具体思路参考《剑指offer》,具体代码如下:

class Solution {
public:
    int lengthOfLongestSubstring(string str) {
      int max_len = 0;//最大值
    int cur_len = 0;//以当前位置的字符结尾的不含重复字符的字符串的最大长度,对应f(i)
    int pos[255] = {0};//记录字符上一次出现的位置
    memset(pos,-1,sizeof(pos));
    int len = str.size();
    for(int i = 0; i < len; i++)
    {
        int pre_index = pos[str[i]];
        if(pre_index < 0 || i - pre_index > cur_len)
            cur_len++;
        else
        {
            cur_len = i - pre_index;
        }
        pos[str[i]] = i;
        if(cur_len > max_len)
            max_len = cur_len;
    }
    return max_len;
    }
};

此方法的时间复杂度同思路三一样,都是O(n),需要注意的是:

如果令dp[i]表示以第i个字符为结尾的不包含重复字符的子串的最长长度,那实际上cur_len这个变量就表示的是dp[i],即这段代码中没有显示的利用dp[i]的形式,因为没必要(我们求得是最大值,当前的结果只受前一个结果的影响,所以一个变量就能解决,没必要把所有的结果都存起来)。

posted on 2017-11-27 12:59  Excaliburer  阅读(2200)  评论(0编辑  收藏  举报