【剑指 Offer】003. 数组中重复的数字
题目描述
找出数组中重复的数字。
在一个长度为 n 的数组 nums 里的所有数字都在 0~n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。示例 1:
输入:
[2, 3, 1, 0, 2, 5, 3]
输出:2 或 3限制:
2 <= n <= 100000
方法一:排序
一个简单的方法是先把输入的数组排序,再在有序的数组中找到重复的数字。
时间复杂度:O(nlogn)
方法二:哈希表
利用哈希表,从头到尾遍历数组,并同时将当前元素加入到哈希表中,如果哈希表已经存在该元素说明重复。
时间复杂度:O(n)
空间复杂度:O(n)
方法三:原地交换
利用鸠占鹊巢思想,由于数组 nums 长度为 n,且数字在 0~n-1 范围内,说明数组元素的值与索引的值能够形成一一对应关系
- 若当前元素值与索引值不相等,说明当前元素存放的位置错了,将它交换至对的位置
- 若当前元素所对应位置上元素也是对的,说明重复
// C++
// 利用 鸠占鹊巢 思想,把 鹊 交换至正确的巢,发现正确的巢已经被鹊占,说明重复
// 会修改原数组,O(n)
int findRepeatNumber2(vector<int> &nums)
{
// 题目已经给定了 nums.size() > 2
for (int i = 0; i < nums.size(); i++)
{
if (nums[i] > nums.size())
return -1;
while (nums[i] != i)
{
if(nums[i] == nums[nums[i]])
return nums[i];
swap(nums[i], nums[nums[i]]);
}
}
return -1;
}
// python
def findRepeatNumber(nums: List[int]) -> int:
if len(nums) == 0:
return -1
i = 0
while i < len(nums):
if nums[i] > len(nums):
return -1
if i == nums[i]:
i += 1
continue
if nums[i] == nums[nums[i]]:
return nums[i]
nums[nums[i]], nums[i] = nums[i], nums[nums[i]]
# nums[i],nums[nums[i]] = nums[nums[i]], nums[i]
return -1
方法四:二分查找
剑指offer 书上提的方法,把取值范围为 0~n-1 的数字从中间数组 m 分为两部分,再扫描整个数组,若 0~m 的数目超过 m+1,说明一定包含重复数字,否则,另一半 m+1~n-1 一定存在重复数字。依次继续,将包含重复数字的区间一分为二,直到找到重复数字。
整个过程和二分查找算法很类似,注意二分的是值,而不是在数组索引上二分。
// 计算 [start, end] 这个区间的数在 nums 中出现的次数
int countRange(const vector<int> nums, int start, int end)
{
if( nums.size() <= 0 )
return 0;
int count = 0;
for(int i = 0; i< nums.size(); i++)
{
if(nums[i] >= start && nums[i] <= end)
count++;
}
return count;
}
int findRepeatNumber(vector<int> &nums)
{
int start = 0;
int end = nums.size() - 1;
while(end >= start)
{
int mid = ((end - start) >> 1) + start;
int count = countRange(nums, start, mid);
// 退出条件
if(start == end)
{
if(count > 1)
return start;
else
break;
}
// 分治
if(count > (mid - start + 1))
end = mid;
else
start = mid + 1;
}
return -1;
}
实际上此方法不能保证找出所有的重复数字,例如子区间元素 [0,0,5,6,7,1,2,3,4,8],在区间 [0,0,5,6,7] 上元素在 0~4 上个数只有 2,不超过 n+1,但是实际上存在重复。