4. Median of Two Sorted Arrays[H]两个有序数组的中位数
题目
There are two sorted arrays nums1 and nums2 of size m and n respectively.
Find the midian of the two sorted arrays. The overall run time complexity should be O(log(m+n)).
You may assume nums1 and nums2 cannot be both empty.
Example1:
nums1 = [1, 3]
nums2 = [2]
The median is 2.0
Example2:
nums1 = [1, 2]
nums2 = [3, 4]
The median is (2+3)/2.0 = 2.5
思路
二分查找、递归法
假设两个数组A和B中的个数都大于\(\frac{k}{2}\)个(存在某一数组个数不足\(\frac{k}{2}\)个),分别取出第\(\frac{k}{2}\)个元素(数组下标为$\frac{k}{2}-$1)进行比较,此时有三种情况:
- A[$\frac{k}{2}-$1] \(\;\)< \(\;\) B[$\frac{k}{2}-$1]
- A[$\frac{k}{2}-$1] \(\;\)=\(\;\) B[$\frac{k}{2}-$1]
- A[$\frac{k}{2}-$1] \(\;\)>\(\;\) B[$\frac{k}{2}-$1]
对于第一种情况,如果A的第 \(\frac{k}{2}\) 个元素(数组下标为 $ \frac{k}{2}-1$ )比B的第 \(\frac{k}{2}\) 个元素(数组下标为 \(\frac{k}{2}-1\) )小,说明当A和B合并之后,A的下标从0到( \(\frac{k}{2}-1\) )之间的数都不可能是第k大的数,即对数组cut的小了,应该增大k。如果相等,就是需要寻找的元素(第k-1个元素)。大于的情况与小于类似。奇数个就取中间的,偶数个将两个数加起来除以2.0即可。
递归的边界条件:
1)其中某一数组为空的话,则直接返回另一个数组下标为[k-1]的数。(见单数组寻找第k个元素)
2)如果k=1,即查找最小值,直接比较两个数组的第1个元素(数组下标为0)即可。
3)如果A[$\frac{k}{2}-\(1]=B[\)\frac{k}{2}-$1],只需要返回其中的一个。
Tips
Cut思想寻找第k个数
通过Cut,将数组切割为左右两部分:\(Left_{part}, Right_{part}\),此时产生两个元素,分别是左边的最大值\(L_{max}\)和右边的最小值\(R_{min}\)。Cut过程中,可以Cut一个数,则这个数既属于左边,又属于右边;也可以在两个数中间Cut。
-
单数组寻找第k个元素
对于有序数组A,在第k个数(数组下标为k-1)cut一下,返回值\(A[k-1]=L{max}\),即为第k个数,该数为左边部分最大值。(k=1,2,...) -
双数组寻找第k个元素
\(left_{part}\) | \(C_i\) | $right_{part} $ |
---|---|---|
\(a_1,a_2,\cdots,a_i\) | / | \(a_{i+1},a_{i+2},\cdots,a_m\) |
\(b_1,b_2,\cdots,b_j\) | / | \(b_{j+1},b_{j+2},\cdots,a_n\) |
定义\(L_{max_1}\),\(L_{max_2}\)为Cut之后\(Left_part\)第1个和第2个数组的最大值,\(R_{min_1}\),\(R_{min_2}\)为Cut之后\(Right_{part}\)第1个和第2个数组的最小值。\(C_1、C_2\)是第1、2个数组的Cut。
如果满足:
1)\(L_{max_1}\;< \;R{min_1}\),\(L_{max_2} \; <\; R_{min_2}\)。(这是一定满足的,因为数组有序,左边一定小于右边。)
2)\(L_{max_1}\;<=\;R_{min_2}\),且\(L_{max_2}\;<=\;R_{min_1}\)。
则\(Left_{part}\)全小于\(Right_{part}\)。如果左边的元素个数加起来刚好等于k,那么第k个元素就是\(Max(L_{max_1},L_{max_2})\)(参见单数组寻找第k个元素)。如果\(L_{max_1}\;>\;R_{min_2}\),说明数组1的左边元素太多(大)了,需要减小\(C_1\),把\(C_2\)增大。同理可得\(L_{max_2}\;>\;R_{min_1}\),将\(C_1\)增大,\(C_2\)减小。
C++
class Solution {
public:
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int n1 = nums1.size();
int n2 = nums2.size();
int total = n1 + n2;
if(total % 2){ //如果数组加起来是奇数
return findKth(nums1, 0, nums2, 0, total / 2 + 1);
}
else{ //如果是偶数
return (findKth(nums1, 0, nums2, 0, total / 2 ) + findKth(nums1, 0, nums2, 0, total / 2 + 1) )/2.0;
}
}
//分割的思想寻找第k个数
double findKth(vector<int>& nums1, int l, vector<int>& nums2, int r, int k){
int n1 = nums1.size();
int n2 = nums2.size();
if(n1 - l > n2 -r )
return findKth(nums2, r, nums1, l, k); //始终保证第一个数组是个数是最少的
if(n1-l == 0)
return nums2[r + k -1];
if(k == 1)
return min(nums1[l], nums2[r]);
int p1 = min(k/2 , n1); //保证在第一个数组内做二分查找。
int p2 = k - p1;
if(nums1[l + p1 -1] < nums2[r + p2 -1]){ //左边
return findKth(nums1, l+p1,nums2, r,k - p1);
}
else if(nums1[l + p1 -1] > nums2[r + p2 -1]){ //左边数组1的个数太大
return findKth(nums1, l,nums2, r+p2,k - p2);
}
else{
return nums1[l+p1-1];
}
}
};
python
class Solution(object):
def findKth(self, nums1, nums2,k):
k = int(k)
n1 = len(nums1)
n2 = len(nums2)
if n1 > n2:
return self.findKth(nums2, nums1, k)
if n1 == 0:
return nums2[k - 1]
if k == 1:
return min(nums1[0], nums2[0])
p1 = int(min(k / 2, n1))
p2 = k - p1
if nums1[p1 - 1] <= nums2[p2 - 1]:
return self.findKth(nums1[p1:], nums2, p2)
else:
return self.findKth(nums1, nums2[p2:], p1)
def findMedianSortedArrays(self, nums1, nums2):
"""
:type nums1: List[int]
:type nums2: List[int]
:rtype: float
"""
n1 = len(nums1)
n2 = len(nums2)
total = n1 + n2
if(total % 2):
return self.findKth(nums1, nums2, total /2 + 1)
else:
return (self.findKth(nums1, nums2, total /2 )+ self.findKth(nums1, nums2, total /2 + 1))/2.0
参考
[1] https://blog.csdn.net/hk2291976/article/details/51107778
[2] https://leetcode.com/problems/median-of-two-sorted-arrays/solution/