438. 找到字符串中所有字母异位词

给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。

字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。

说明:

  • 字母异位词指字母相同,但排列不同的字符串。
  • 不考虑答案输出的顺序。
  • 示例 1:
输入:
s: "cbaebabacd" p: "abc"

输出:
[0, 6]

解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。
 示例 2:

输入:
s: "abab" p: "ab"

输出:
[0, 1, 2]

解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。

思路: 在s中保持长度为len(p)的窗口,利用counter滑动检查所有字母异位词(通过不断往字典中添加、删除元素),时间复杂度为O(len(s))。

class Solution:        
    def findAnagrams(self, s, p):
        """
        :type s: str
        :type p: str
        :rtype: List[int]
        """
        from collections import Counter
        res = list()
        
        p_counter = Counter(p)
        s_counter = Counter(s[:len(p)-1])
        
        for i in range(len(p)-1, len(s)):
            s_counter[s[i]] += 1              # add a new character
            if s_counter == p_counter:
                res.append(i-len(p)+1)                 # add start index value
            s_counter[s[i-len(p)+1]] -= 1     # delete the first char in the substr
            if s_counter[s[i-len(p)+1]] == 0:
                del s_counter[s[i-len(p)+1]]  # delete old char when the count is zero
        
        return res
posted @ 2018-07-24 21:09  yuyin  阅读(273)  评论(0编辑  收藏  举报