187. 重复的DNA序列(中)

题目

  • DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。
    例如,"ACGAATTCCG" 是一个 DNA序列 。
    在研究 DNA 时,识别 DNA 中的重复序列非常有用。
    给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

示例 1:

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]

示例 2:

输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]

题解:滑动窗口

  • 分析:#窗口长度固定为10,每次滑动1,把子串加入一个列表,统计子串的出现次数,出现次数为2就符合题目要求加入结果列表
class Solution:
    def findRepeatedDnaSequences(self, s: str) -> List[str]:
        count = {}#字典 count 来存储子串的计数
        ans = []
        for i in range(len(s) - 10 + 1):#遍历每一个长度为10的子串
            t = s[i : i + 10]
            count.setdefault(t, 0)#访问不存在的键时自动创建并将值设置为 0
            count[t] += 1#把当前子串计数加1,更改当前键对应的值
            if count[t] == 2:#如果当前子串的计数为2
                ans.append(t)#加入结果列表
        return ans
posted @ 2024-03-20 16:20  Frommoon  阅读(17)  评论(0编辑  收藏  举报