Loading

【剑指 Offer】003. 数组中重复的数字

题目描述

找出数组中重复的数字。
在一个长度为 n 的数组 nums 里的所有数字都在 0~n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。

示例 1:
输入:
[2, 3, 1, 0, 2, 5, 3]
输出:2 或 3

限制:
2 <= n <= 100000

方法一:排序

一个简单的方法是先把输入的数组排序,再在有序的数组中找到重复的数字。

时间复杂度:O(nlogn)

方法二:哈希表

利用哈希表,从头到尾遍历数组,并同时将当前元素加入到哈希表中,如果哈希表已经存在该元素说明重复。

时间复杂度:O(n)
空间复杂度:O(n)

方法三:原地交换

利用鸠占鹊巢思想,由于数组 nums 长度为 n,且数字在 0~n-1 范围内,说明数组元素的值与索引的值能够形成一一对应关系

  • 若当前元素值与索引值不相等,说明当前元素存放的位置错了,将它交换至对的位置
  • 若当前元素所对应位置上元素也是对的,说明重复
// C++
// 利用 鸠占鹊巢 思想,把 鹊 交换至正确的巢,发现正确的巢已经被鹊占,说明重复
// 会修改原数组,O(n)
int findRepeatNumber2(vector<int> &nums)
{
    // 题目已经给定了 nums.size() > 2
    for (int i = 0; i < nums.size(); i++)
    {
        if (nums[i] > nums.size())
            return -1;

        while (nums[i] != i)
        {
            if(nums[i] == nums[nums[i]])
                return nums[i];

            swap(nums[i], nums[nums[i]]);
        }
    }
    return -1;
}
// python
def findRepeatNumber(nums: List[int]) -> int:
    if len(nums) == 0:
        return -1

    i = 0
    while i < len(nums):
        if nums[i] > len(nums):
            return -1
        if i == nums[i]:
            i += 1
            continue
        if nums[i] == nums[nums[i]]:
            return nums[i]
        nums[nums[i]], nums[i] = nums[i], nums[nums[i]]
        # nums[i],nums[nums[i]] = nums[nums[i]], nums[i]
    return -1

方法四:二分查找

剑指offer 书上提的方法,把取值范围为 0~n-1 的数字从中间数组 m 分为两部分,再扫描整个数组,若 0~m 的数目超过 m+1,说明一定包含重复数字,否则,另一半 m+1~n-1 一定存在重复数字。依次继续,将包含重复数字的区间一分为二,直到找到重复数字。

整个过程和二分查找算法很类似,注意二分的是值,而不是在数组索引上二分。

// 计算 [start, end] 这个区间的数在 nums 中出现的次数
int countRange(const vector<int> nums, int start, int end)
{
    if( nums.size() <= 0 )
        return 0;
    
    int count = 0;
    for(int i = 0; i< nums.size(); i++)
    {
        if(nums[i] >= start && nums[i] <= end)
            count++;
    }
    return count;
}

int findRepeatNumber(vector<int> &nums)
{
    int start = 0;
    int end = nums.size() - 1;
    
    while(end >= start)
    {
        int mid = ((end - start) >> 1) + start;
        int count = countRange(nums, start, mid);

        // 退出条件
        if(start == end)
        {
            if(count > 1)
                return start;
            else 
                break;
        }

        // 分治
        if(count > (mid - start + 1))
            end = mid;
        else
            start = mid + 1;
    }
    
    return -1;
}

实际上此方法不能保证找出所有的重复数字,例如子区间元素 [0,0,5,6,7,1,2,3,4,8],在区间 [0,0,5,6,7] 上元素在 0~4 上个数只有 2,不超过 n+1,但是实际上存在重复。

posted @ 2021-12-29 13:56  锦瑟,无端  阅读(44)  评论(0编辑  收藏  举报