求第k小的数 O(n)复杂度
博客转载地址:https://blog.csdn.net/flyawayl/article/details/53538369
思路:
利用快速排序的思想,把数组递归划分成两部分。设划分为x,数组左边是小于等于x,右边大于x。
关键在于寻找一个最优的划分,经过 Blum 、 Floyd 、 Pratt 、 Rivest 、 Tarjan五位大牛的研究总结,提出了BFPRT 算法(也就是中位数的中位数算法)。
解决方案
利用中位数的中位数算法得到的数作为划分可以实现最优划分–在最差情况下能实现O(n)复杂度。接下来考虑可能出现许多重复的数,假设数组中所有的数全部相同,每次划分之后都是当前区间的右端点,即会退化到O(n^2)复杂度。
优化方法
一个比较好的办法就是改写partion算法,设每次划分的标准数为x,将所有的与x相等的元素集中到一起,例如数组a[]={4,4,4,2,1,4,5,6},x=4,划分之后应该是{1,2,4,4,4,4,5,6}。很容易能得到等于x的元素的个数cnt,接下来就是决策的处理:
设当前划分的下标为ind.
如果ind+1==k,直接返回a[ind]
如果ind+1<k,递归进入[ind+1,r)的区间继续寻找答案
接下来就是处理重复元素的关键步骤,如果ind+1>k
可分成两种情况:
1、k位于重复元素[ind+1-cnt+1,ind+1]之中,直接返回a[ind],直接结束程序.
2、k位于所有重复元素之前,则应该丢弃重复元素,递归进入[l,ind-cnt+1)的区间继续寻找答案
当然,这题n<=10^6,直接用sort以O(nlgn)也能过。
代码
#include<cstdio>
#include<algorithm>
using namespace std;
const int maxn=1e6+5;
int a[maxn];
int n,k;
inline int findmid(int l,int r){ //中位数的中位数
if(r-l<=5) return (l+r)/2;
for(int i=0;i<(r-l)/5;++i){
sort(a+l+i*5,a+l+i*5+5);
swap(a[l+i],a[l+i*5+2]);
}
return findmid(l,l+(r-l)/5);
}
int partion(int l,int r,int &p){ //改进版partion
int h=findmid(l,r);
swap(a[h],a[r-1]);
p=0;
int ind=l-1;
for(int i=l;i<r-1;++i){
if(a[i]==a[r-1]) ++p;
if(a[i]<=a[r-1])
swap(a[++ind],a[i]);
}
++p;
swap(a[++ind],a[r-1]);
int i=l,j=ind-1;
while(i<j){
if(a[i]==a[ind]){
while(a[j]==a[ind]) --j;
if(i<j){
swap(a[i],a[j]);
--j;
}
}
++i;
}
return ind;
}
int solve(int l,int r){
int p=0;
int ind=partion(l,r,p);
if(ind+1==k) return a[ind];
if(ind+1>k){
if(ind+1-p+1<=k) return a[ind];
else return solve(l,ind-p+1);
}
if(ind+1<k) return solve(ind+1,r);
}
int main(){
scanf("%d%d",&n,&k);
for(int i=0;i<n;++i) scanf("%d",&a[i]);
printf("%d\n",solve(0,n));
return 0;
}