47. 数组中出现次数超过一半的数字[Number appears more than half times]
【题目】:数组中有一个数字出现的次数超过了数组长度的一半,找出这个数字。
例如长度为9的数组{1,2,3,2,2,2,5,4,2}中次数超过了数组长度的一半的数字为2,而长度为8的数组{1,2,3,2,2,2,5,4}则为非法输入。
【思路一】:先对数组进行排序,再遍历排序后的数组,统计每个数的次数,出现次数最大的数即为要找的数。
时间复杂度:O(nlgn)+ O(n)= O(nlgn);空间复杂度:O(1)。
【思路二】:先对数组进行排序,出现次数超过数组长度的一半的数必然是数组中间的那个数。
时间复杂度:O(nlgn)+ O(1)= O(nlgn);空间复杂度:O(1)。
【思路三】:使用Hash表。遍历数组中的每个数字,找到它在哈希表中对应的位置并增加它出现的次数。Hash表只适用于元素的范围(range)比较小的情况,而假设我们的数组是一个整型数组,取值范围跨度太大,所以不适合用哈希表,太浪费空间了。
时间复杂度:O(n);空间复杂度:O(range)。
【思路四】:既然该数字为数组的中位数,即长度为n的数组中第[n/2]大数字。那么有没有更快的方法求解?我们已经有成熟的O(n)算法求解数组的第K大数字,即Kmin。那么可以借鉴其思想。
时间复杂度:O(n);空间复杂度:O(1)。
缺点是由于使用了QuickSort的Partition算法,需要交换数组中数字顺序,会修改输入数组。
具体代码如下:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 |
// 47_NumberAppearMoreThanHalf.cpp : Defines the entry point for the console application.
// #include "stdafx.h" #include <iostream> using namespace std; bool g_bValid = true; // swap a and b void myswap(int &a, int &b) { int t = a; a = b; b = t; } // use Partition of QuickSort to get Kmin int Partition(int a[], int left, int right) {// partition so that a[left..p-1]<a[p] and a[p+1..right]>=a[p] int pivot = a[left], i = left , j = right; while (i < j) { // i from left, j from right while (a[i] <= pivot ) i++; while (a[j] > pivot ) j--; if (i < j) myswap(a[i],a[j]); } myswap(a[left],a[j]); return j; } // check whether array is valid bool IsArrayValid(int a[],int n) { g_bValid = true; if(NULL==a||n<=0) { g_bValid = false; } return g_bValid; } // check whether result appears more than half bool IsAppearMoreThanHalf(int a[],int n,int result) { int times = 0; for (int i=0;i<n;++i) if (a[i]==result) times++; bool bIsMoreThanHalf = true; if (2*times<=n) { g_bValid = false; bIsMoreThanHalf = false; } return bIsMoreThanHalf; } // get number which appears more than half of array int NumberAppearMoreThanHalf_Solution1(int a[],int n) {// O(n) // whether array is valid if (!IsArrayValid(a,n)) return 0; int left = 0; int right = n-1; int middle = n/2; int pivot = Partition(a,left,right); while(pivot!=middle) { if (pivot<middle) { left = pivot+1; pivot =Partition(a,left,right); } else { right = pivot-1; pivot =Partition(a,left,right); } } // pivot == middle int result = a[middle]; // check whether result appears more than half if (!IsAppearMoreThanHalf(a,n,result)) return 0; return result; } // get number which appears more than half of array int NumberAppearMoreThanHalf_Solution2(int a[],int n) {// O(n) // whether array is valid if (!IsArrayValid(a,n)) return 0; int result = a[0]; int appearTimes = 1; for (int i=1;i<n;++i) { if (a[i]==result) appearTimes++; else appearTimes--; if (appearTimes==0) { result = a[i]; appearTimes = 1; } } // check whether result appears more than half if (!IsAppearMoreThanHalf(a,n,result)) return 0; return result; } void test_base(int a[],int n) { int result = NumberAppearMoreThanHalf_Solution2(a,n); if (g_bValid) cout<<result<<endl; else cout<<"Invalid array."<<endl; } void test_case1() { int a[] = {1,2,3,2,2,2,5,4,2}; int n = sizeof(a)/sizeof(int); test_base(a,n); // 2 } void test_case2() { int a[] = {1,2,3,2,2,2,5,4}; int n = sizeof(a)/sizeof(int); test_base(a,n); // invalid array } void test_main() { test_case1(); test_case2(); } int _tmain(int argc, _TCHAR* argv[]) { test_main(); return 0; } |
【思路五】:数组中有个数字出现的次数超过了数组长度的一半。也就是说,有个数字出现的次数比其他所有数字出现次数的和还要多。因此我们可以考虑在遍历数组的时候保存两个值:一个是数组中的一个数字,一个是其对应的出现次数。当我们遍历到下一个数字的时候,如果下一个数字和我们之前保存的数字相同,则次数加1。如果下一个数字和我们之前保存的数字不同,则次数减1。如果次数为零,我们需要保存下一个数字,并把次数设为1。这样最后剩下的数字肯定就是出现次数超过数组长度一半的数字。
时间复杂度:O(n);空间复杂度:O(1)。
相比【思路四】不会修改输入数组。
具体代码如下:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
// get number which appears more than half of array
int NumberAppearMoreThanHalf_Solution2(int a[],int n) {// O(n) // whether array is valid if (!IsArrayValid(a,n)) return 0; int result = a[0]; int appearTimes = 1; for (int i=1;i<n;++i) { if (a[i]==result) appearTimes++; else appearTimes--; if (appearTimes==0) { result = a[i]; appearTimes = 1; } } // check whether result appears more than half if (!IsAppearMoreThanHalf(a,n,result)) return 0; return result; } |
【参考】
http://zhedahht.blog.163.com/blog/static/25411174201085114733349/
http://www.cnblogs.com/python27/archive/2011/12/15/2289534.html