438. 找到字符串中所有字母异位词
给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。
字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。
说明:
- 字母异位词指字母相同,但排列不同的字符串。
- 不考虑答案输出的顺序。
- 示例 1:
输入:
s: "cbaebabacd" p: "abc"
输出:
[0, 6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。
示例 2:
输入:
s: "abab" p: "ab"
输出:
[0, 1, 2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。
思路: 在s中保持长度为len(p)的窗口,利用counter滑动检查所有字母异位词(通过不断往字典中添加、删除元素),时间复杂度为O(len(s))。
class Solution:
def findAnagrams(self, s, p):
"""
:type s: str
:type p: str
:rtype: List[int]
"""
from collections import Counter
res = list()
p_counter = Counter(p)
s_counter = Counter(s[:len(p)-1])
for i in range(len(p)-1, len(s)):
s_counter[s[i]] += 1 # add a new character
if s_counter == p_counter:
res.append(i-len(p)+1) # add start index value
s_counter[s[i-len(p)+1]] -= 1 # delete the first char in the substr
if s_counter[s[i-len(p)+1]] == 0:
del s_counter[s[i-len(p)+1]] # delete old char when the count is zero
return res