程序员面试题目总结--数组(三)【旋转数组的最小数字、旋转数组中查找指定数、两个排序数组所有元素中间值、数组中重复次数最多的数、数组中出现次数超过一半的数】
转!http://blog.csdn.net/dabusideqiang/article/details/38271661
11、求旋转数组的最小数字
题目:输入一个排好序的数组的一个旋转,输出旋转数组的最小元素。
分析:数组的旋转:把一个数组最开始的若干个元素搬到数组的末尾。例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转,该数组的最小值为1。这道题最直观的解法并不难。从头到尾遍历数组一次,就能找出最小的元素,时间复杂度显然是O(N)。但这个思路没有利用输入数组的特性,我们应该能找到更好的解法。
我们注意到旋转之后的数组实际上可以划分为两个排序的子数组,而且前面的子数组的元素都大于或者等于后面子数组的元素。我们还可以注意到最小的元素刚好是这两个子数组的分界线。我们试着用二元查找法的思路在寻找这个最小的元素。
首先我们用两个指针,分别指向数组的第一个元素和最后一个元素。按照题目旋转的规则,第一个元素应该是大于或者等于最后一个元素的(这其实不完全对,还有特例。后面再讨论特例)。
接着我们得到处在数组中间的元素。如果该中间元素位于前面的递增子数组,那么它应该大于或者等于第一个指针指向的元素。此时数组中最小的元素应该位于该中间元素的后面。我们可以把第一指针指向该中间元素,这样可以缩小寻找的范围。同样,如果中间元素位于后面的递增子数组,那么它应该小于或者等于第二个指针指向的元素。此时该数组中最小的元素应该位于该中间元素的前面。我们可以把第二个指针指向该中间元素,这样同样可以缩小寻找的范围。我们接着再用更新之后的两个指针,去得到和比较新的中间元素,循环下去。
按照上述的思路,我们的第一个指针总是指向前面递增数组的元素,而第二个指针总是指向后面递增数组的元素。最后第一个指针将指向前面子数组的最后一个元素,而第二个指针会指向后面子数组的第一个元素。也就是它们最终会指向两个相邻的元素,而第二个指针指向的刚好是最小的元素。这就是循环结束的条件。
注:
1、前面提到在旋转数组中,由于是把递增排序数组前面的若干数字搬到数组的后面,因此第一个数字总是大于或等于最后一个数字,但有个特例:把排序数组前面的0个元素搬到后面,即数组没有改变,还是原来的排序数组。此时,数组中第一个数字就是最小数字。
2、当两个指针指向的数字和中间数字相同时,无法判断中间的数字式位于前面的子数组中还是后面的子数组中,则上面的方法就失效了。此时,则使用顺序查找方法。
- bool glo_InvalidInput=false;
- int MinInOrder(int* numbers, int index1, int index2);
- int Min(int* numbers, int length)
- {
- if(numbers == NULL || length <= 0)
- {
- glo_InvalidInput=true;
- return -1;
- }
- int index1 = 0;
- int index2 = length - 1;
- int indexMid = index1;
- while(numbers[index1] >= numbers[index2])
- {
- // 如果index1和index2指向相邻的两个数,
- // 则index1指向第一个递增子数组的最后一个数字,
- // index2指向第二个子数组的第一个数字,也就是数组中的最小数字
- if(index2 - index1 == 1)
- {
- indexMid = index2;
- break;
- }
- // 如果下标为index1、index2和indexMid指向的三个数字相等,
- // 则只能顺序查找
- indexMid = (index1 + index2) / 2;
- if(numbers[index1] == numbers[index2] && numbers[indexMid] == numbers[index1])
- return MinInOrder(numbers, index1, index2);
- // 缩小查找范围
- if(numbers[indexMid] >= numbers[index1])
- index1 = indexMid;
- else if(numbers[indexMid] <= numbers[index2])
- index2 = indexMid;
- }
- return numbers[indexMid];
- }
- int MinInOrder(int* numbers, int index1, int index2)
- {
- int result = numbers[index1];
- for(int i = index1 + 1; i <= index2; ++i)
- {
- if(result > numbers[i])
- result = numbers[i];
- }
- return result;
- }
12、在旋转数组中查找指定的数(无重复元素)
题目:在旋转数组中查找指定的数,找到返回下标,否则返回-1
分析:数组的旋转:把一个数组最开始的若干个元素搬到数组的末尾。例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}
我们注意到旋转之后的数组实际上可以划分为两个排序的子数组,可以试着用二元查找法的思路在寻找指定的元素。
- /************************************************************************
- * 数组中没有重复数字
- ************************************************************************/
- int SearchRotatedArray(int a[], int n, int value)
- {
- if(a==NULL || n <=0)
- return -1;
- int begin=0, end=n-1;
- while(begin!=end)
- {
- int mid=(begin+end)/2;
- if(value == a[mid])
- return mid;
- if(a[begin] < a[mid])
- {
- if(a[begin] <= value && value < a[mid])
- end=mid;
- else
- begin=mid;
- }
- else
- {
- if(a[mid] < value && value <=a[end])
- begin=mid;
- else
- end=mid;
- }
- }
- return -1;
- }
扩展:上面题目中若允许有重复数字如何处理?
分析:
允许重复元素,则上一题中如果A[m]>=A[l], 那么[l,m] 为递增序列的假设就不能成立了,比
如[1,3,1,1,1]。
如果A[m]>=A[l] 不能确定递增,那就把它拆分成两个条件:
• 若A[m]>A[l],则区间[l,m] 一定递增
• 若A[m]==A[l] 确定不了,那就l++,往下看一步即可。
- /************************************************************************
- * 数组中存在重复数字
- ************************************************************************/
- int SearchRotatedArray1(int a[], int n, int value)
- {
- if(a==NULL || n <=0)
- return -1;
- int begin=0, end=n-1;
- while(begin!=end)
- {
- int mid=(begin+end)/2;
- if(value == a[mid])
- return mid;
- if(a[begin] < a[mid])
- {
- if(a[begin] <= value && value < a[mid])
- end=mid;
- else
- begin=mid;
- }
- else if(a[begin] > a[mid])
- {
- if(a[mid] < value && value <=a[end])
- begin=mid;
- else
- end=mid;
- }
- else
- begin++;
- }
- return -1;
- }
13、求两个排序数组中的所有元素中间值
题目:给定两个已经排序的数组,找出两者所有元素中的中间值
分析:这是一道非常经典的题。这题更通用的形式是,给定两个已经排序好的数组,找到两者所有元素中第k 大的元素。
O(m + n) 的解法比较直观,直接merge 两个数组,然后求第k 大的元素。
不过我们仅仅需要第k 大的元素,是不需要“排序”这么复杂的操作的。可以用一个计数器,记录当前已经找到第m 大的元素了。同时我们使用两个指针pA 和pB,分别指向A 和B 数组的第一个元素,使用类似于merge sort 的原理,如果数组A 当前元素小,那么pA++,同时m++;如果数组B 当前元素小,那么pB++,同时m++。最终当m 等于k 的时候,就得到了我们的答案,O(k)时间,O(1) 空间。但是,当k 很接近m + n 的时候,这个方法还是O(m + n) 的。
有没有更好的方案呢?我们可以考虑从k 入手。如果我们每次都能够删除一个一定在第k 大元素之前的元素,那么我们需要进行k 次。但是如果每次我们都删除一半呢?由于A 和B 都是有序的,我们应该充分利用这里面的信息,类似于二分查找,也是充分利用了“有序”。
假设A 和B 的元素个数都大于k/2,我们将A 的第k/2 个元素(即A[k/2-1])和B 的第k/2个元素(即B[k/2-1])进行比较,有以下三种情况(为了简化这里先假设k 为偶数,所得到的结论对于k 是奇数也是成立的):
• A[k/2-1] == B[k/2-1]
• A[k/2-1] > B[k/2-1]
• A[k/2-1] < B[k/2-1]
如果A[k/2-1] < B[k/2-1],意味着A[0] 到A[k/2-1 的肯定在A U B 的top k 元素的范围内,换句话说,A[k/2-1]不可能大于A U B 的第k 大元素。留给读者证明。
因此,我们可以放心的删除A 数组的这k/2 个元素。同理,当A[k/2-1] > B[k/2-1] 时,可以删除B 数组的k/2 个元素。
当A[k/2-1] == B[k/2-1] 时,说明找到了第k 大的元素,直接返回A[k/2-1] 或B[k/2-1]即可。
因此,我们可以写一个递归函数。那么函数什么时候应该终止呢?
• 当A 或B 是空时,直接返回B[k-1] 或A[k-1];
• 当k=1 是,返回min(A[0], B[0]);
• 当A[k/2-1] == B[k/2-1] 时,返回A[k/2-1] 或B[k/2-1]
- bool glo_InvalidInput=false;
- int find_kth(int A[], int m, int B[], int n, int k)
- {
- //always assume that m is equal or smaller than n
- if (m > n) return find_kth(B, n, A, m, k);
- if (m == 0) return B[k - 1];
- if (k == 1) return min(A[0], B[0]);
- //divide k into two parts
- int ia = min(k / 2, m), ib = k - ia;
- if (A[ia - 1] < B[ib - 1])
- return find_kth(A + ia, m - ia, B, n, k - ia);
- else if (A[ia - 1] > B[ib - 1])
- return find_kth(A, m, B + ib, n - ib, k - ib);
- else
- return A[ia - 1];
- }
- double findMedianSortedArrays(int A[], int m, int B[], int n)
- {
- if(A == NULL || B==NULL || (m <= 0 && n <=0))
- {
- glo_InvalidInput=true;
- return -1;
- }
- int total = m + n;
- if (total & 0x1)
- return find_kth(A, m, B, n, total / 2 + 1);
- else
- return (find_kth(A, m, B, n, total / 2)
- + find_kth(A, m, B, n, total / 2 + 1)) / 2.0;
- }
14、找出数组中重复次数最多的数
题目:给定一个数组,找出数组中出现重复次数最多的数
分析:
方法一:以空间换时间,可以定义一个数组 int count[MAX],并将其数组元素都初始化为0,然后执行for(int i=0;i<n;i++) count[A[i]]++;在count中找最大的数,即为重复次数最多的数。
- int GetMaxNum(int a[], int n ,int& num)
- {
- int index=a[0];
- for(int i=0;i<n;i++)
- {
- if(a[i]>index)
- {
- index=a[i];
- num=i;
- }
- }
- return index;
- }
- int main()
- {
- int a[]={1,1,2,2,4,4,4,4,5,5,6,6};
- int len=sizeof(a)/sizeof(a[0]);
- int num=0;
- int n=GetMaxNum(a,len,num);
- int *count = new int[n+1];
- for(int i=0;i<n;i++)
- count[i]=0;
- for(int i=0;i<len;i++)
- count[a[i]]++;
- cout << "重复的次数:" << GetMaxNum(count,n,num) << endl;
- cout << "重复次数最多的数:"<< num << endl;
- delete[] count;
- }
方法二:使用map映射,通过引入map表来记录每一个元素出现的次数,然后判断次数的大小,进而找出重复次数最多的元素
- //找出数组中重复次数最多的数
- #include<iostream>
- #include<map>
- using namespace std;
- bool FindMostFrequentNum(int a[],int n, int& val, int& num)
- {
- if(a==NULL || n<=0)
- return false;
- map<int,int> m;
- for(int i=0;i<n;i++)
- {
- if(++m[a[i]] > m[val])
- val=a[i];
- }
- num=m[val];
- return true;
- }
- int main()
- {
- int a[]={1,5,4,3,4,4,5,4,4,5,6};
- int len=sizeof(a)/sizeof(a[0]);
- int val=0;
- int num=0;
- if(FindMostFrequentNum(a,len,val,num))
- {
- cout << "重复的次数:" << num << endl;
- cout << "重复次数最多的数:"<< val << endl;
- }
- }
15、求数组中出现次数超过一半的数
题目:在O(n)时间复杂度内找出数组中出现次数超过一半的数
分析:每次取出两个不同的数,剩下的数字中重复出现的数字肯定比其他数字多,将规模缩小化,如果每次删除两个不同的数,那么在剩余的数字里,原最高频数出现的频率一样超过了50%,不断重复这个过程,最后剩下的将全是同样的数字,即最高频数。
- //在O(n)时间复杂度内找出数组中出现次数超过一半的数
- int Find(int a[], int n)
- {
- if(a==NULL || n <=0)
- return -1;
- int candidate=0;
- int count=0;
- for(int i=0;i<n;i++)
- {
- if(count==0)
- {
- candidate=a[i];
- count=1;
- }
- else
- {
- if(candidate==a[i])
- count++;
- else
- count--;
- }
- }
- count=0;
- for(int i=0;i<n;i++)
- {
- if(a[i]==candidate)
- count++;
- }
- if(count*2 <= n)
- return -1;
- return candidate;
- }