剑指offer面试题29:数组中出现次数超过一半的数字
题目:数组中有一个数字出现的次数超过数组长度的一般,请找出这个数字,例如输入一个长度为9的数组(1,2,3,2,2,2,5,4,2,)。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。
个人第一眼想法是通过一个sort函数,再判断中间那数出现次数,只要出现多于n/2,就直接输出。
一般来说,最为直观的算法面试官都不会满意,那么有没有更优的算法呢?
这种算法是受快速排序算法的启发。在随机快速排序算法中,我们现在数组中随机选择一个数字,然后调整数组中数字的顺序,使得比选中的数字小的数字都排在它的左边,比选中的数字大的数字都排在它的右边。如果这个选中的数字的下标刚好是n/2,那么这个数字就是数组的中位数。如果它的下标大于n/2,那么中位数应该位于它的左边,我们可以接着在它的左边部分的数组中查找。如果它的下标小于n/2,那么中位数应该位于它的右边,我们可以接着在它的右边部分的数组中查找。这是一个典型的递归过程,实现代码如下:
1 int MoreThanHalfNum_Solution(vector<int> numbers) 2 { 3 int length = numbers.size(); 4 if (numbers.empty() || length<0) 5 return 0; 6 7 int begin = 0; 8 int end = length - 1; 9 int middle = length >> 1; 10 int index = 0; 11 //利用 12 while (begin<end) 13 { 14 index = Partition(numbers, begin, end); 15 if (index == middle) 16 { 17 break; 18 } 19 else if (index > middle) 20 { 21 end = index - 1; //则值在左边部分的数组。 22 } 23 else 24 { 25 begin = index + 1;//则值在右边部分的数组。 26 } 27 } 28 //检查该值是否超过数组长度的一半 29 int cnt = 0; 30 for (int i = 0; i < length; ++i) 31 { 32 if (numbers[index] == numbers[i]) 33 cnt++; 34 } 35 if (cnt * 2 > length) return numbers[index]; 36 37 return 0; 38 }
一.基于partition函数的O(n)算法
算法一
partition函数思路:
- 使用第一个数组元素作为枢轴点,即为pivot;
- 使用一个指针去扫描整个数组,凡是小于pivot的全部放到数组左端;
- 最后将pivot放到数组中间的位置,pivot左边全部都是小于它的数字,右边反之,最后返回pivot的位置信息;
代码如下:
1 void swap(int &x, int &y) 2 { 3 int t = x; 4 x = y; 5 y = t; 6 7 } 8 int partition(vector<int> &nums, int begin, int end) 9 { 10 int pivot = nums[begin];//枢轴(也可以是在begin和end之间的随机数) 11 // Last position where puts the no_larger element. 12 //凡是小于pivot的全部放到数组左端,pos指向<枢轴值的最后一个 13 //pos++指向不满足条件的(用于交换,将满足条件的换过来) 14 int pos = begin; 15 for (int i = begin + 1; i < end; ++i) 16 { 17 if (nums[i] < pivot) 18 { 19 pos++; 20 if (i != pos) //避免自身交换 21 swap(nums[pos], nums[i]); 22 } 23 24 } 25 swap(nums[pos], nums[begin]); 26 return pos; 27 }
算法分析
这种实现思路比较直观,但是其实并不高效。从直观上来分析一下,每个小于pivot的值基本上(除非到现在为止还没有遇见大于pivot的值)都需要一次交换,大于pivot的值(有可能需要被交换多次才能到达最终的位置。
算法二
算法思路
- 就如快速排序中最常使用的那样,使用两个指针分别从头部和尾部进行扫描,头部遇到大于pivot的数和尾部遇到小于pivot的数进行交换;
- 使用了两个指针,效率更高一点;避免使用swap函数
如果我们考虑用 Two Pointers 的思想,保持头尾两个指针向中间扫描,每次在头部找到大于pivot的值,同时在尾部找到小于pivot的值,然后将它们做一个交换,就可以一次把这两个数字放到最终的位置。一种比较明智的写法如下:
//Two Pointers思想的分割函数(begin为0,end为n-1) int Partition(vector<int> &nums, int begin, int end) { int pivot = nums[begin];//第一个记录作为枢轴(也可是在begin和end之间的随机数) while (begin < end) { while (begin < end && nums[end] >= pivot) { end--; } nums[begin] = nums[end];//尾部找到小于pivot的值,移到低端 while (begin < end && nums[begin] <= pivot) { begin++; } nums[end] = nums[begin];//头部找到大于pivot的值,移到高端 } nums[begin] = pivot;//枢轴基准归位 return begin; }
算法分析:赋值操作不多,效率会更高
二分Partition算法
快速排序算法
void quickSort(vector<int> &nums, int begin, int end) { if (begin >= end) return; int index = partition(nums, begin, end); if (index>begin) quickSort(nums, begin, index-1); if (index<end) quickSort(nums, index+1, end); } 调用: quickSort(vec, 0, vec.size()-1); //end为n-1