[OI] 整体二分

整体二分可以理解成普通二分改版,其实并没有改多少,并且一般对 check() 函数的复杂度要求更宽松

先来看一道经典题目:求区间排名

给一个数列,若干组询问 \((l,r,k)\),求 \([l,r]\) 内第 \(k\) 大,询问次数较大

注意到询问次数较大,因此需要整体二分来解决

首先考虑普通二分,很容易想到一个比较暴力的想法:对值域二分,每次暴力遍历一遍 \([l,r]\),把大于 \(mid\) 的都挑出来,假如个数比 \(k\) 多则二分左区间,否则二分右区间

这是一种比较无脑的 \(n\log n\) 二分方法,现在我们来尝试把它改造成整体二分:

首先定义一个求解范围 \([L,R]\),表示我们现在正在求解编号 \([L,R]\) 范围内的询问,初始的时候令这个范围为 \([1,q]\)

然后,我们进行正常二分,此时应该枚举 \(mid=\frac{n}{2}\)

还是按照上面的办法,暴力遍历一遍 \([l,r]\),把大于 \(mid\) 的都挑出来

然后我们可以确定出每一个询问区间里大于 \(mid\) 的数有多少个,对于此题来说,只需要求一遍前缀和即可进行维护

此时会发现询问分为了两类:一类是区间内大于 \(mid\) 的数比询问的 \(k\) 更多,另一类反之

因此我们可以直接给询问重新排序,将它们分成两拨,一类都在左边,一类都在右边

容易发现,左边的询问只需要二分 \([l,mid]\) 即可,而右边的询问仅需要二分 \([mid+1,r]\) 即可,这样便可以缩减复杂度

void check(int l,int r,int L,int R){
    //[l,r] 为值域区间, [L,R] 为询问区间
    if(l==r){
        //二分结束,统计答案
        for(int i=L;i<=R;++i){
            ans[q[i].id]=l;
        }
        return;
    }
    int mid=(l+r)/2;
    for(int i=1;i<=n;++i){
        sum[i]=sum[i-1]+(a[i]<=mid);
    }
    int cnt1=0,cnt2=0;
    //lst1,lst2 分别统计两类询问的编号,cnt1/2 是给这两个数组计数用的
    //注意这两个 cnt1/2 一定要开成局部变量!!!否则会因为递归修改了值导致直接炸掉
    for(int i=L;i<=R;++i){
        int res=sum[q[i].r]-sum[q[i].l-1];
        if(res<=q[i].k){
            lst1[++cnt1]=i;
        }
        else{
            lst2[++cnt2]=i;
        }
    }
    //按顺序合并询问
    int now=L-1;
    for(int i=1;i<=cnt1;++i){
        id[++now]=lst1[i];
    }
    for(int i=1;i<=cnt2;++i){
        id[++now]=lst2[i];
    }
    //继续二分
    check(l,mid,L,L+cnt1-1);
    check(mid+1,r,L+cnt1,R);
}
#include<bits/stdc++.h>
using namespace std;
#define int long long
const int inf=1e9+7;
struct node{
	int x,y,type,id,k;
}q[200001],q1[200001],q2[200001];
int n,m;
int ans[100001];
long long a[200001],b[200001],ori[200001];
/*-----BIT-----*/
int tree[200001];
inline int lowbit(int x){return x&(-x);}
void add(int x,int y){
	for(;x<=n;x+=lowbit(x)){
		tree[x]+=y;
	}
}
int ask(int x){
	int ans=0;
	for(;x;x-=lowbit(x)){
		ans+=tree[x];
	}
	return ans;
}
/*-----END-----*/
void check(int l,int r,int L,int R){
	if(l>r or L>R) return;
	if(L==R){
		for(int i=l;i<=r;i++){
			if(q[i].type==2){
				ans[q[i].id]=L;
			}
		}
		return;
	}
	int mid=(L+R)/2;
	int cnt1=0,cnt2=0;
	for(int i=l;i<=r;i++){
		if(q[i].type==1){
			if(q[i].x<=mid){
				add(q[i].id,1);
				q1[++cnt1]=q[i];
			}
			else{
				q2[++cnt2]=q[i];
			}
		}
		else{
			int res=ask(q[i].y)-ask(q[i].x-1);
			if(res>=q[i].k){
				q1[++cnt1]=q[i];
			}
			else{
				q[i].k-=res;
				q2[++cnt2]=q[i];
			}
		}
	}
	for(int i=1;i<=cnt1;i++){
		if(q1[i].type==1){
			add(q1[i].id,-1);
		}
	}
	int now=l-1;
	for(int i=1;i<=cnt1;i++){
		q[++now]=q1[i];
	}
	for(int i=1;i<=cnt2;i++){
		q[++now]=q2[i];
	}
	check(l,l+cnt1-1,L,mid);
	check(l+cnt1,r,mid+1,R);
}
signed main(){
//	freopen("test9.in","r",stdin);
//	freopen("out.out","w",stdout);
	scanf("%lld %lld",&n,&m);
	for(int i=1;i<=n;i++){
		scanf("%lld",&a[i]);
		b[i]=a[i];
	}
	sort(b+1,b+n+1);
	int tem=unique(b+1,b+n+1)-b-1;
	for(int i=1;i<=n;++i){
		int ret=a[i];
		a[i]=lower_bound(b+1,b+tem+1,a[i])-b;
		ori[a[i]]=ret;
	}
	for(int i=1;i<=n;i++){
		q[i].x=a[i];
		q[i].type=1;
		q[i].id=i;
	}
	for(int i=1;i<=m;i++){
		scanf("%lld %lld %lld",&q[i+n].x,&q[i+n].y,&q[i+n].k);
		q[i+n].type=2;
		q[i+n].id=i;
		q[i+n].k=q[i+n].y-q[i+n].x+1-q[i+n].k+1;
	}
	check(1,n+m,1,tem);
	for(int i=1;i<=m;i++){
		printf("%lld\n",ori[ans[i]]);
	}
}

相似的问题可以去看 P1527,是一道二维的区间排名问题,因此处理的时候不能再只使用前缀和了

以及 P3527,这是一道一维的带修问题,不过它求的不是排名,所以也异曲同工了

一维带修排名问题也可以整体二分,详见 P3332

posted @ 2024-09-03 21:42  HaneDaniko  阅读(31)  评论(1编辑  收藏  举报