如何在O(n)的时间复杂度内找出数组中出现次数超过了一半的数

方法一:每次取出两个不同的数,剩下的数字中重复出现次数超过一半的数字肯定,将规模缩小化。如果每次删除两个不同的数,这里当然不是真的把它们踢出数组,而是对于候选数来说,出现次数减一,对于其他数来说,循环遍历就行。在剩余的数字里,原最高频数出现的频率一样超过了50%,不断重复这个过程,最后剩下的将全是同样的数字,即最高频数。此算法避免了排序,时间复杂度只有O(n).

程序示例如下:

#include "stdafx.h"
#include <stdio.h>

int FindMostApperse(int* num, int len)
{
	int candidate = 0;
	int count = 0;
	for (int i = 0; i < len; i++)
	{		
		if (count == 0)
		{
			candidate = num[i];
			count = 1;
		}
		else
		{
			if (candidate == num[i])
				count++;
			else
				count--;
		}
		printf("num[%d]=%d,count=%d,candidate=%d\n", i, num[i], count, candidate);
	}
	return candidate;
}
int main()
{
	int arr[] = { 2, 1, 1, 2, 3, 1, 1, 1 };
	int len = sizeof(arr) / sizeof(arr[0]);
	printf("%d\n", FindMostApperse(arr, len));
	getchar();
	return 0;
}

  效果如图:

方法二:Hash法。首先创建一个hash_map,其中key为数组元素值,value为此数出现的次数。遍历一遍数组,用hash_map统计每个数出现的次数,并用两个值存储目前出现次数最多的数和对应出现的次数,此时的时间复杂度为O(n),空间复杂度为O(n),满足题目的要求。

方法三:原创,用map,不知时间复杂度是否符合要求,代码如下:

#include "stdafx.h"
#include <iostream>
#include <map>
using namespace std;
bool findOverHalf(int *a, int size, int &val)
{
	if (a == NULL || size <= 0)
		return false;
	map<int, int> m;
	for (int i=0; i < size; i++)
	{
		m[a[i]]++;
		if (m[a[i]]>size / 2)
		{
			val = a[i];
			return true;
		}
	}
	return false;
}
int main()
{
	int val = 0;
	int a[] = { 1, 5, 4, 3, 4, 4, 0, 5, 5, 5, 5 };
	if (findOverHalf(a, 11, val))
		cout << val << endl;
	else
		cout << "无出现次数过半的数" << endl;
	getchar();
	return 0;
}
posted @ 2014-03-07 21:02  源子陌  Views(1144)  Comments(0Edit  收藏  举报