【哈希表】LeetCode 49. 字母异位词分组【中等】

给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。

字母异位词是由重新排列源单词的字母得到的一个新单词，所有源单词中的字母通常恰好只用一次。

示例 1:

输入: strs = ["eat", "tea", "tan", "ate", "nat", "bat"]
输出: [["bat"],["nat","tan"],["ate","eat","tea"]]

示例 2:

输入: strs = [""]
输出: [[""]]

示例 3:

输入: strs = ["a"]
输出: [["a"]]

提示：

1 <= strs.length <= 104
0 <= strs[i].length <= 100
strs[i] 仅包含小写字母

【分析】

两个字符串互为字母异位词，当且仅当两个字符串包含的字母相同。同一组字母异位词中的字符串具备相同点，可以使用相同点作为一组字母异位词的标志，使用哈希表存储每一组字母异位词，哈希表的键为一组字母异位词的标志，哈希表的值为一组字母异位词列表。

遍历每个字符串，对于每个字符串，得到该字符串所在的一组字母异位词的标志，将当前字符串加入该组字母异位词的列表中。遍历全部字符串之后，哈希表中的每个键值对即为一组字母异位词。

以下两种方法分别使用排序和计数作为哈希表的键。

方法一：排序

由于互为字母异位词的两个字符串包含的字母相同，因为对两个字符串分别进行排序之后得到的字符串一定是相同的，故可以将排序之后的字符串作为哈希表的键。

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        mp = collections.defaultdict(list) # 定义哈希表

        for st in strs:
            key = "".join(sorted(st)) # 字符串排序，作为字典key
            mp[key].append(st) # 键为排序后的字符串，值为原始字符串

        return list(mp.values()) # 返回list格式的字典的值即可

# 时间复杂度：O(nklogk)。其中n是strs中的字符串的数量，k是strs中的字符串的最大长度。需要遍n个字符串，对于每个字符串，需要O(klogk)的时间进行排序以及O(1)的时间更新哈希表，因此总时间复杂度是O(nklogk)
# 空间复杂度：O(nk)。n是strs中字符串的数量，k是strs中字符串的最大长度。需要用哈希表存储全部字符串。

方法二：计数

由于互为字母异位词的两个字符串包含的字母相同，因此两个字符串中的相同字母出现的次数一定是相同的，故可以将每个字母出现的次数使用字符串表示，作为哈希表的键。

由于字符串只包含小写字母，因此对于每个字符串，可以使用长度为26的数组记录每个字母出现的次数。需要注意的是，在使用数组作为哈希表的键时，不通语言的支持程度不同，因此不同语言的实现方式也不同。

class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        mp = collections.defaultdict(list)

        for st in strs:
            counts = [0] * 26
            for ch in st:
                counts[ord(ch) - ord("a")] += 1
            # 需要将 list 转换成 tuple 才能进行哈希
            mp[tuple(counts)].append(st)
        
        return list(mp.values())

posted @ 2022-05-05 13:56 Ariel_一只猫的旅行阅读(87) 评论(0) 编辑收藏举报

刷新页面返回顶部

【哈希表】LeetCode 49. 字母异位词分组【中等】

公告