CDQ分治与整体二分小结

前言

  这是一波强行总结。

  下面是一波瞎比比。

  这几天做了几道CDQ/整体二分,感觉自己做题速度好慢啊。

  很多很显然的东西都看不出来 分治分不出来 打不出来 调不对

  上午下午晚上的效率完全不一样啊。

  完蛋.jpg 绝望.jpg。

 

关于CDQ分治

  CDQ分治,求的是三维偏序问题都知道的。

  求法呢,就是在分治外面先把一维变成有序

  然后分治下去,左边(l,mid)关于右边(mid+1,r)就不存在某一维的逆序了,所以只有两维偏序了。

  这个时候来一波"树状数组求逆序对"的操作搞一下二维偏序

  就可以把跨过中线的,左边更新右边的情况计算出来。

  注意:只计算左边的操作对右边的询问的贡献!

  然后左右两边递归处理就好了。

  正确性:按照线段树的形态递归的CDQ分治,保证每一对三元组在第一维划分的线段树上都有且仅有一个LCA(这不废话吗),而这一组答案就会且仅会在LCA处计算。如果在LCA下面,点对不在一个work内自然不会计算。如果在LCA上面了,点对就在同一侧,不会互相更新。

  复杂度:设一次work的复杂度是f(len),则复杂度是O(f(n)logn)。

  一般都在分治里用树状数组,一般的复杂度就是O(nlog2n)的。

  一般是这样的套路:假设三维偏序分别为a,b,c;

  在main函数里保证a递增。

  然后在CDQ里先分治左右,传下去的时候a仍然递增,不破坏性质。

  然后分治完左右两边后,需保证左右两边分别b都是递增的(a不重要)。

  然后就是类似归并排序的操作了。

  此时左边的a肯定都小于右边的a,那么如果对于一个右边的元素

  之前类似归并的操作就可以保证所有小于b的左边的元素都已经遍历过。

  那么找c也小于它的?值域线段树/树状数组等数据结构维护一下就好了。

  然后你这么归并了一波后,就发现统计完答案后b是有序递增的了(这个时候a已经不重要了)。

  对于上层操作,符合"左右两边分别b是递增的"了。

  BZOJ陌上花开竟然是权限题?这是在搞笑。

  好吧BZOJ动态逆序对,之前写过的,做两次CDQ就好了。

  BZOJ稻草人,也是CDQ,加个单调栈。

 

还有一个就是高维偏序问题。

cogs上的2479 HZOI2016 偏序 就是四维偏序板子。

后面还有两个加强版,到了七维,不是CDQ干的事情,详情请见这个PPT

校内交流所以做的不是很严谨(吐舌)

这里只谈论四维偏序,即a<a'   b<b'   c<c'   d<d'。

做法是喜闻乐见的CDQ套CDQ套树状数组。

有个很妙的博客:Candy?

首先在外面按照a排好序。

进第一层CDQ。先递归处理,然后标记本来是在mid左边还是右边的,左1右0,然后按b排序。

还是只统计左边部分跨过中线对右边部分的贡献。

按照b排好序后,就变成了统计标记为0的点的"在它左边的、标记为1的、(c,d)都小于它的点的个数"。

"在它左边+(c,d)都小于它" = 三维偏序。

复制到另一个数组里再做一次cdq就可以了。

复杂度O(nlog^3n)。

 

#include    <iostream>
#include    <cstdio>
#include    <cstdlib>
#include    <algorithm>
#include    <vector>
#include    <cstring>
#include    <queue>
#include    <complex>
#include    <stack>
#define LL long long int
#define dob double
#define FILE "partial_order"
//#define FILE "CDQ"
using namespace std;

const int N = 100010;
struct Data{int a,b,c,id;}p[N],que[N],que2[N];
int n,vis[N],tim,T[N];
LL Ans;

inline int gi(){
  int x=0,res=1;char ch=getchar();
  while(ch>'9'||ch<'0'){if(ch=='-')res*=-1;ch=getchar();}
  while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
  return x*res;
}

inline void update(int x){
  for(;x<=n;x+=x&-x){
    if(vis[x]!=tim)T[x]=0,vis[x]=tim;
    T[x]++;
  }
}

inline int query(int x,int ans=0){
  for(;x;x-=x&-x){
    if(vis[x]!=tim)T[x]=0,vis[x]=tim;
    ans+=T[x];
  }
  return ans;
}

inline void cdq(int l,int r){
  if(l==r)return;
  int mid=(l+r)>>1,i=l,j=mid+1,k=l;
  cdq(l,mid);cdq(mid+1,r);tim++;
  while(i<=mid && j<=r){
    if(que[i].b<que[j].b){
      if(que[i].id)update(que[i].c);
      que2[k++]=que[i++];
    }
    else{
      if(!que[j].id)Ans+=query(que[j].c);
      que2[k++]=que[j++];
    }
  }
  while(i<=mid)que2[k++]=que[i++];
  while(j<=r){
    if(!que[j].id)Ans+=query(que[j].c);
    que2[k++]=que[j++];
  }
  for(k=l;k<=r;++k)que[k]=que2[k];
}

inline void CDQ(int l,int r){
  if(l==r)return;
  int mid=(l+r)>>1,i=l,j=mid+1,k=l;
  CDQ(l,mid);CDQ(mid+1,r);
  while(i<=mid && j<=r){
    if(p[i].a<p[j].a)que[k]=p[i++],que[k++].id=1;
    else que[k]=p[j++],que[k++].id=0;
  }
  while(i<=mid)que[k]=p[i++],que[k++].id=1;
  while(j<=r)que[k]=p[j++],que[k++].id=0;
  for(k=l;k<=r;++k)p[k]=que[k];cdq(l,r);
}

int main()
{
  freopen(FILE".in","r",stdin);
  freopen(FILE".out","w",stdout);
  n=gi();
  for(int i=1;i<=n;++i)p[i].a=gi();
  for(int i=1;i<=n;++i)p[i].b=gi();
  for(int i=1;i<=n;++i)p[i].c=gi();
  CDQ(1,n);printf("%lld\n",Ans);
  fclose(stdin);fclose(stdout);
  return 0;
}
CDQ套CDQ

 

 

 

 

关于整体二分

  整体二分主要是把所有询问放在一起二分答案,然后把操作也一起分治。

  什么时候用呢?

  当你发现多组询问可以离线的时候

  当你发现询问可以二分答案而且check复杂度对于单组询问可以接受的时候

  当你发现询问的操作都是一样的的时候

  你就可以使用整体二分这个东西了。

  具体做法讲起来有些玄学,其实类似主席树转化到区间的操作或者线段树上二分。

  想想:二分答案的时候,对于一个答案,是不是有些操作是没用的,有些操作贡献是不变的?

  比如二分一个时间,那么时间后面发生的操作就是没有用的,时间前面的贡献是不变的。

  二分一个最大值,比mid大的都是没用的,比mid小的个数是一定的。

  整体二分就是利用了这么一个性质。

  平时我们二分答案,都是这么写的:

 

inline int check(int mid){
  int num=0;
  for(int i=1;i<=m;++i)
    if(calc(i,mid))
      num++;
  return num;
}

...

int l=...,r=...,ans=-1;
while(l<=r){
  int mid=(l+r)>>1;
  if(check(mid)<k)l=mid+1;
  else ans=mid,r=mid-1;
}
1.0

  这种写法已经很优秀了。但是如果有q次询问,复杂度就是O(qmlogn)。

  换种方式:

 

inline bool check(int mid){
  int t1=0,t2=0;
  for(int i=1;i<=m;++i){
    if(calc(i,mid))que[1][++t1]=i;
    else que[2][++t2]=i;
  }
  if(t1>=k){
    m=t1;
    for(int i=1;i<=m;++i)opt[i]=que[1][i];
    return 1;
  }
  else{
    m=t2;
    for(int i=1;i<=m;++i)opt[i]=que[2][i];
    k-=t1;return 0;
  }
}

...

int l=...,r=...,ans=-1;
while(l<=r){
  int mid=(l+r)>>1;
  if(check(mid))r=mid-1,ans=mid;
  else l=mid+1;
}
2.0

 

  (如上面代码有错误请指出)

  分析起来复杂度并没有什么改变......

  但是如果把二分答案看成一棵二叉树,每个点(区间[l,r])的权值为check的操作数。

  把当前是第几次二分看成这个区间的深度(层)。

  每一层的区间相互没有交。

  那么有一个优秀的性质:只有log层,每一层的点权和为O(m)。

  所以这个时候对于多组询问一起处理,复杂度为O((m+q)logn)。

  

  二分答案,然后把没有用的操作扫进右边,和答案在[mid+1,r]的询问一起递归处理。

  把有用的操作放进左边,减去不变的贡献,和答案在[l,mid]的一起递归处理。

  注意答案在[mid+1,r]的询问要算上放进了左边的操作的贡献,开个变量记下来/直接减掉都可以。

  注意整体二分在solve内的复杂度一定只能与区间长度线性相关,不能每次都有别的复杂度!

  比如一次solve的复杂度是O(lenlogn)就可以,O(len+sqrt(n))就不行。

  大概就是这么一个东西。

  复杂度?和CDQ是一样的,都是O(f(len)logn)。

  例题?BZOJ3110 K大数查询 Codevs Meteors。

  一样的套路了。

 

关于一些要注意的地方

  归并一定要把剩下的搞完!每次我都忘记这码子事!

  树状数组不能暴力清零!记个time或者依葫芦画瓢减回去都可以,一定不能清零!

  不要在CDQ里面套sort,太慢辣!(一定进不了第一版的!)

 

posted @ 2017-08-26 22:38  Fenghr  阅读(7386)  评论(6编辑  收藏  举报