从找朋友到找变位词：一道趣味字符串问题的深入解析｜LeetCode 438 找到字符串中所有字母异位词

LeetCode 438 找到字符串中所有字母异位词

点此看全部题解 LeetCode必刷100题：一份来自面试官的算法地图（题解持续更新中）

生活中的算法

还记得小时候玩的"找朋友"游戏吗？每个人都有一个字母牌，需要找到拥有相同字母组合的伙伴。比如，拿着"ate"的同学要找到拿着"eat"或"tea"的同学。这其实就是在寻找字母异位词！

在实际应用中，字母异位词的检测有着广泛的用途。比如在密码学中检测可能的密文变体，或在文本分析中找出词语的不同排列组合。

问题描述

LeetCode第438题"找到字符串中所有字母异位词"是这样描述的：给定两个字符串 s 和 p，找到 s 中所有 p 的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。

异位词指由相同字母重排列形成的字符串（包括相同的字符串）。

例如：

输入: s = “cbaebabacd”, p = “abc”
输出: [0,6]
解释: 起始索引等于 0 的子串是 “cba”, 它是 “abc” 的异位词。起始索引等于 6 的子串是 “bac”, 它也是 “abc” 的异位词。

最直观的解法：排序比较法

最容易想到的方法是：取出s中长度等于p的每个子串，将子串和p分别排序后比较是否相等。如果相等，就找到了一个异位词。

让我们用一个例子来模拟这个过程：

s = "cbae", p = "abc"

检查所有长度为3的子串：
"cba" -> 排序后："abc" = "abc"（p排序后） ✓
"bae" -> 排序后："abe" ≠ "abc"（p排序后） ✗

这种思路可以用Java代码这样实现：

public List<Integer> findAnagrams(String s, String p) {
    List<Integer> result = new ArrayList<>();
    if (s.length() < p.length()) return result;
    
    // 将p排序
    char[] sortedP = p.toCharArray();
    Arrays.sort(sortedP);
    
    // 检查每个可能的子串
    for (int i = 0; i <= s.length() - p.length(); i++) {
        // 取出子串并排序
        char[] window = s.substring(i, i + p.length()).toCharArray();
        Arrays.sort(window);
        
        // 比较排序后的字符串
        if (Arrays.equals(window, sortedP)) {
            result.add(i);
        }
    }
    
    return result;
}

优化解法：滑动窗口 + 字符计数法

仔细思考会发现，我们其实不需要对字符串排序。只要两个字符串包含相同的字符，且每个字符出现的次数相同，它们就是异位词。这启发我们使用字符计数的方法。

结合滑动窗口技巧，我们可以在一次遍历中完成所有比较。

算法原理

使用数组记录p中每个字符的出现次数
维护一个大小等于p长度的滑动窗口
对窗口中的字符计数，与p的字符计数比较
当找到匹配时记录起始索引

算法步骤（伪代码）

初始化两个大小为26的数组，分别记录p和窗口中字符出现次数
先统计p中字符出现次数
使用滑动窗口遍历s：
- 右边加入新字符，更新计数
- 当窗口大小超过p长度时，左边移除字符，更新计数
- 比较两个计数数组是否相等

示例运行

让我们用s = “cbae”, p = "abc"模拟这个过程：

初始状态：
p的字符计数：[a:1, b:1, c:1]
窗口字符计数：[]

1. 添加'c'：
   窗口计数：[c:1]
   
2. 添加'b'：
   窗口计数：[b:1, c:1]
   
3. 添加'a'：
   窗口计数：[a:1, b:1, c:1]
   比较：相等 ✓
   记录索引0
   
4. 添加'e'，移除'c'：
   窗口计数：[a:1, b:1, e:1]
   比较：不等 ✗

Java代码实现

public List<Integer> findAnagrams(String s, String p) {
    List<Integer> result = new ArrayList<>();
    if (s.length() < p.length()) return result;
    
    // 使用数组记录字符出现次数
    int[] pCount = new int[26];
    int[] windowCount = new int[26];
    
    // 统计p中字符出现次数
    for (char c : p.toCharArray()) {
        pCount[c - 'a']++;
    }
    
    // 初始化窗口
    for (int i = 0; i < p.length(); i++) {
        windowCount[s.charAt(i) - 'a']++;
    }
    
    // 如果初始窗口就是异位词
    if (Arrays.equals(pCount, windowCount)) {
        result.add(0);
    }
    
    // 滑动窗口
    for (int i = p.length(); i < s.length(); i++) {
        // 移除窗口最左边的字符
        windowCount[s.charAt(i - p.length()) - 'a']--;
        // 添加新的字符
        windowCount[s.charAt(i) - 'a']++;
        
        // 比较是否是异位词
        if (Arrays.equals(pCount, windowCount)) {
            result.add(i - p.length() + 1);
        }
    }
    
    return result;
}