leetcode 4. 寻找两个正序数组的中位数 (二分)
题目描述:
给定两个大小为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出这两个正序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。你可以假设 nums1 和 nums2 不会同时为空。
题解:
转自(https://leetcode-cn.com/problems/median-of-two-sorted-arrays/solution/xiang-xi-tong-su-de-si-lu-fen-xi-duo-jie-fa-by-w-2/)。不妨换个思路,题目要求的是中位数,其实也就是求第$k$小数的一种特殊情况,而求第k小的话有一种算法。假设我们要找第 k
小数,我们可以每次循环排除掉 k/2
个数。看下边一个例子。假设我们要找第 7 小的数字,如下图:
我们比较两个数组的第 $k/2$ 个数字,如果 $k$是奇数,向下取整。也就是比较第$3$个数字,上边数组中的$4$和下边数组中的$3$,如果哪个小,就表明该数组的前$k/2$个数字都不是第$k$小数字,所以可以排除。也就是 $1$,$2$,$3$这三个数字不可能是第$7$小的数字,我们可以把它排除掉。将$1349$和$45678910$两个数组作为新的数组进行比较。
更一般的情况 $A[1] ,A[2] ,A[3],A[k/2] ... ,B[1],B[2],B[3],B[k/2] ... $,如果 $A[k/2]<B[k/2]$ ,那么$A[1],A[2],A[3],A[k/2]$都不可能是第$k$小的数字。$A$ 数组中比 $A[k/2]$ 小的数有 $k/2-1$ 个,$B$ 数组中,$B[k/2]$ 比 $A[k/2]$ 小,假设 $B[k/2]$ 前边的数字都比 $A[k/2]$ 小,也只有 $k/2-1$ 个,所以比 $A[k/2]$ 小的数字最多有 $k/1-1+k/2-1=k-2$个,所以 $A[k/2]$ 最多是第 $k-1$ 小的数。而比 $A[k/2]$ 小的数更不可能是第 $k$小的数了,所以可以把它们排除。橙色的部分表示已经去掉的数字。
由于我们已经排除掉了 $3$个数字,就是这$3$个数字一定在最前边,所以在两个新数组中,我们只需要找第 $7 - 3 = 4$小的数字就可以了,也就是 $k = 4$。此时两个数组,比较第$ 2$ 个数字,$3 < 5$,所以我们可以把小的那个数组中的 $1 ,3$排除掉了。
我们又排除掉 $2$ 个数字,所以现在找第 $4 - 2 = 2$ 小的数字就可以了。此时比较两个数组中的第 $k / 2 = 1$ 个数,$4 == 4$,怎么办呢?由于两个数相等,所以我们无论去掉哪个数组中的都行,因为去掉 $1$ 个总会保留 1 个的,所以没有影响。为了统一,我们就假设$4 > 4$ 吧,所以此时将下边的 4 去掉。
由于又去掉 1 个数字,此时我们要找第 1 小的数字,所以只需判断两个数组中第一个数字哪个小就可以了,也就是 4。所以第 7 小的数字是 4。我们每次都是取 $k/2$的数进行比较,有时候可能会遇到数组长度小于 k/2的时候。
此时 $k/2$ 等于 3,而上边的数组长度是 2,我们此时将箭头指向它的末尾就可以了。这样的话,由于 $2 < 3$,所以就会导致上边的数组 1,2 都被排除。造成下边的情况。
由于 2 个元素被排除,所以此时 k = 5,又由于上边的数组已经空了,我们只需要返回下边的数组的第 5 个数字就可以了。
从上边可以看到,无论是找第奇数个还是第偶数个数字,对我们的算法并没有影响,而且在算法进行中,k 的值都有可能从奇数变为偶数,最终都会变为 1 或者由于一个数组空了,直接返回结果。
所以我们采用递归的思路,为了防止数组长度小于 k/2,所以每次比较 min(k/2,len(数组) 对应的数字,把小的那个对应的数组的数字排除,将两个新数组进入递归,并且 k 要减去排除的数字的个数。递归出口就是当 k=1 或者其中一个数字长度是 0 了。
AC代码:
class Solution { public: int getK(vector<int> nums1,vector<int> nums2,int s1,int e1,int s2,int e2,int k) { int len1 = e1-s1+1; int len2 = e2-s2+1; //让 len1 的长度小于 len2,这样就能保证如果有数组空了,一定是 len1 if(len1 > len2) return getK(nums2,nums1,s2,e2,s1,e1,k); if (len1 == 0) return nums2[s2 + k - 1]; if (k == 1) return min(nums1[s1], nums2[s2]); int i = s1 + min(len1, k / 2) - 1; int j = s2 + min(len2, k / 2) - 1; if (nums1[i] > nums2[j]) { // return getKth(nums1, start1, end1, nums2, j + 1, end2, k - (j - start2 + 1)); return getK(nums1,nums2,s1,e1,j+1,e2,k - (j - s2 + 1)); } else { // return getKth(nums1, i + 1, end1, nums2, start2, end2, k - (i - start1 + 1)); return getK(nums1,nums2,i+1,e1,s2,e2,k-(i-s1+1)); } } double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) { int n = nums1.size(); int m = nums2.size(); int l = (n+m+1)/2; int r = (n+m+2)/2; //将偶数和奇数的情况合并,如果是奇数,会求两次同样的 k 。 return (getK(nums1,nums2,0,n-1,0,m-1,l) + getK(nums1,nums2,0,n-1,0,m-1,r))*0.5; } };