【LeetCode摩尔投票】有趣的简单题:数组中出现次数超过一半的数字
数组中出现次数超过一半的数字
https://leetcode.cn/problems/shu-zu-zhong-chu-xian-ci-shu-chao-guo-yi-ban-de-shu-zi-lcof/
数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。
你可以假设数组是非空的,并且给定的数组总是存在多数元素。
示例 1:
输入: [1, 2, 3, 2, 2, 2, 5, 4, 2]
输出: 2
限制:
1 <= 数组长度 <= 50000
初见思路:哈希表+排序
我的初见思路是用hash表统计个元素出现次数,然后排序,最后看排序后是否有元素的出现次数大于数组的长度的一半
有就返回该值实现代码如下:
class Solution {
public:
class cmp{
public:
bool operator()(pair<int, int>& a, pair<int, int>& b){
return a.second > b.second;
}
};
int majorityElement(vector<int>& nums) {
unordered_map<int, int> hash4Count;
for(int num : nums) hash4Count[num]++;
vector<pair<int, int>> vec4sort(hash4Count.begin(), hash4Count.end());
sort(vec4sort.begin(), vec4sort.end(), cmp());
int numLen = nums.size() / 2;
if(vec4sort[0].second > numLen) return vec4sort[0].first;
else return -1;
}
};
该代码可以通过题目给的用例
但是,在一些特殊情况下,上述代码会有错误
例如,在测试用例[1,2,3,3,3,2,3,4,2]中,上述代码运行错误,原因是正是使用了哈希表和排序
测试用例[1,2,3,3,3,2,3,4,2]中,数字3出现的次数超过了数组长度的一半,因此应该返回3,但是由于哈希表对键值对的遍历顺序不确定,因此在将哈希表中的数据按照出现次数排序时,可能会出现3排在2的前面,从而导致算法返回错误的结果。
由于上述原因,使用哈希表的思路修改多次都会在某些情况下发生错误(尝试的修改包括:直接修改哈希表和排序的部分,遍历哈希表中的键值对,找到出现次数最多的那个数字,如果它的出现次数超过了数组长度的一半,则返回该数字,否则返回-1。仍然错误)
因此,应该换个思路
思路2:排序与众数
还是拿刚刚的用例[1,2,3,3,3,2,3,4,2]
对其进行排序可以得到[1,2,2,2,3,3,3,3,4]
我们发现"3"正好位于数组中间位置,这不是巧合,因为题目要求的数,该数的出现次数要大于数组长度的一半
在此规则下,数组排序之后,中间位置就会是我们要找的数,这个数也就是所谓的"众数"
class Solution {
public:
int majorityElement(vector<int>& nums) {
sort(nums.begin(), nums.end());
return nums[nums.size()/2];
}
};
这次ac了,代码还超级简单。。。
这种算法的时间复杂度为 O(nlogn),其中 n 是数组大小。
思路3:摩尔投票
回到之前的思路,如果要选一种代替哈希表+排序的思路,那么最正统的应该是Boyer-Moore算法(摩尔投票)
假设当前数字num是众数,初始时将计数器count4Vote赋为1。
随后遍历数组,如果元素与num相同,则将计数器加1,否则将计数器减1。
当计数器变为0时,说明之前遍历过的所有数字中,num出现的次数不足一半,因此可以将num更新为当前遍历的数字,并将计数器重新设为1。最终留下来的num即为所求的答案。
class Solution {
public:
int majorityElement(vector<int>& nums) {
int count4Vote = 1;//记录投票的变量
int num = nums[0];//众数,初始化为第一个数
for(int i = 1; i < nums.size(); i++){
if(nums[i] == num) count4Vote++;
else{
count4Vote--;//出现不同的元素,之前元素"投的票"减1
if(count4Vote == 0){//当减完之后,上一个投票的元素就被踢掉了,当前遍历元素作为"投票者"继续游戏
num = nums[i];
count4Vote = 1;//票数重置
}
}
}
return num;//返回最后剩下的数,即"投票者"
}
};
这种方法的性能要好于排序后取中间值
时间和空间复杂度为 O(n)和 O(1)