187. 重复的DNA序列(中)
题目
- DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:
输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
题解:滑动窗口
- 分析:#窗口长度固定为10,每次滑动1,把子串加入一个列表,统计子串的出现次数,出现次数为2就符合题目要求加入结果列表
class Solution:
def findRepeatedDnaSequences(self, s: str) -> List[str]:
count = {}#字典 count 来存储子串的计数
ans = []
for i in range(len(s) - 10 + 1):#遍历每一个长度为10的子串
t = s[i : i + 10]
count.setdefault(t, 0)#访问不存在的键时自动创建并将值设置为 0
count[t] += 1#把当前子串计数加1,更改当前键对应的值
if count[t] == 2:#如果当前子串的计数为2
ans.append(t)#加入结果列表
return ans