从拼积木到最长连续序列:一道别出心裁的数组题目|LeetCode 128 最长连续序列

LeetCode 128 最长连续序列

点此看全部题解 LeetCode必刷100题:一份来自面试官的算法地图(题解持续更新中)

生活中的算法

你小时候一定玩过数字积木吧?一堆写着不同数字的积木块散落在地上,你会不自觉地想把连续的数字找出来,按顺序排成一行。比如看到3、4、5,就会把它们放在一起,因为它们是连续的。

这就是我们今天要讲的"最长连续序列"问题的生活原型。不过,这道题更有趣的地方在于:它要求我们在不对数组排序的情况下,找出这样的连续序列。就像是在不整理积木的情况下,用眼睛找出最长的连续数字链。

问题描述

LeetCode第128题"最长连续序列"是这样描述的:给定一个未排序的整数数组nums,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。要求算法的时间复杂度为O(n)。

例如,给定nums = [100, 4, 200, 1, 3, 2],最长的连续序列是[1, 2, 3, 4],所以答案是4。

最直观的解法:排序法

最容易想到的方法就是:先把数组排序,然后找最长的连续序列。就像我们整理积木时,先把所有积木按数字大小排好,然后就能轻松找到最长的连续数字链。

具体步骤是这样的:

  1. 将数组排序
  2. 遍历排序后的数组,记录当前连续序列的长度
  3. 如果下一个数不连续,就重新开始计数
  4. 记录所有连续序列中的最大长度

让我们用一个例子来模拟这个过程:

原数组:[100, 4, 200, 1, 3, 2]
排序后:[1, 2, 3, 4, 100, 200]

遍历过程:
1 -> 当前长度=1
2 -> 连续,长度=2
3 -> 连续,长度=3
4 -> 连续,长度=4
100 -> 不连续,重新开始,长度=1
200 -> 不连续,重新开始,长度=1

最长连续序列的长度 = 4

这种思路可以用Java代码这样实现:

public int longestConsecutive(int[] nums) {
    if (nums.length == 0) return 0;
    
    // 先排序
    Arrays.sort(nums);
    
    int maxLength = 1;
    int currentLength = 1;
    
    for (int i = 1; i < nums.length; i++) {
        // 跳过重复元素
        if (nums[i] == nums[i-1]) continue;
        
        // 判断是否连续
        if (nums[i] == nums[i-1] + 1) {
            currentLength++;
            maxLength = Math.max(maxLength, currentLength);
        } else {
            currentLength = 1;
        }
    }
    
    return maxLength;
}

但这个解法的时间复杂度是O(nlogn),不满足题目要求的O(n)。我们需要想出更巧妙的方法。

优化解法:哈希集合法

仔细思考一下,每个连续序列都有一个起点(序列中的最小数字)。如果我们能快速判断一个数字是否是某个连续序列的起点,问题就简化了。

哈希集合法的原理

  1. 用哈希集合存储所有数字,实现O(1)时间的查找
  2. 对于每个数字x,如果x-1不存在,说明x可能是一个连续序列的起点
  3. 从这个起点开始,不断查找下一个数字,直到连续性破坏
  4. 记录过程中找到的最长序列

算法步骤(伪代码)

  1. 创建哈希集合,存入所有数字
  2. 遍历数组中的每个数字x:
    • 如果x-1不在集合中(说明是起点)
    • 从x开始,尝试找x+1, x+2, …直到找不到为止
    • 更新最长序列的长度
  3. 返回最长长度

示例运行

让我们用示例数组[100, 4, 200, 1, 3, 2]模拟运行过程:

首先创建哈希集合:{1, 2, 3, 4, 100, 200}

检查100:
- 99不在集合中,100是起点
- 找101,不存在
- 长度为1

检查4:
- 3在集合中,跳过

检查200:
- 199不在集合中,200是起点
- 找201,不存在
- 长度为1

检查1:
- 0不在集合中,1是起点
- 找2,存在
- 找3,存在
- 找4,存在
- 找5,不存在
- 长度为4

...剩余数字都不是起点,跳过

Java代码实现

public int longestConsecutive(int[] nums) {
    // 创建哈希集合,存入所有数字
    Set<Integer> set = new HashSet<>();
    for (int num : nums) {
        set.add(num);
    }
    
    int maxLength = 0;
    
    // 遍历set中每个数字
    for (int num : set) {
        // 如果num-1存在,说明num不是序列的起点,跳过
        if (!set.contains(num - 1)) {
            int currentNum = num;
            int currentLength = 1;
            
            // 不断查找下一个数字
            while (set.contains(currentNum + 1)) {
                currentNum++;
                currentLength++;
            }
            
            maxLength = Math.max(maxLength, currentLength);
        }
    }
    
    return maxLength;
}

排序法vs哈希集合法

让我们比较这两种解法:

排序法的时间复杂度是O(nlogn),空间复杂度是O(1)(如果不考虑排序的空间开销)。它的优点是直观、易于理解,适合处理有序或接近有序的数据。

哈希集合法的时间复杂度是O(n),空间复杂度是O(n)。虽然需要额外的空间来存储哈希集合,但它能满足题目的时间复杂度要求。关键是它通过空间换时间的方式,避免了排序的开销。

题目模式总结

这道题体现了一个重要的算法思想:通过预处理数据结构来优化查找

这种思想在很多场景中都很有用,比如:

  • 查找数组中是否存在某个元素的补数
  • 判断数组中是否存在重复元素
  • 检查字符串中的字符是否出现过

解决这类问题的通用思路是:

  1. 观察问题中的查找模式
  2. 选择合适的数据结构来优化查找操作
  3. 在某些情况下,可以用空间换时间来提高效率

小结

通过这道题,我们不仅学会了如何找最长连续序列,更重要的是理解了"用合适的数据结构优化查找"这一重要思想。有时候,看似复杂的问题,只要换个角度思考,选择合适的数据结构,就能得到优雅的解法。

记住,算法设计不仅是about解决问题,更是about如何优雅高效地解决问题!


作者:忍者算法
公众号:忍者算法

posted @   忍者算法  阅读(12)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· [翻译] 为什么 Tracebit 用 C# 开发
· 腾讯ima接入deepseek-r1,借用别人脑子用用成真了~
· Deepseek官网太卡,教你白嫖阿里云的Deepseek-R1满血版
· DeepSeek崛起:程序员“饭碗”被抢,还是职业进化新起点?
· RFID实践——.NET IoT程序读取高频RFID卡/标签
点击右上角即可分享
微信分享提示