[知识学习] 主席树

这两天学习了主席树,基本上搞懂了主席树是怎么操作的


主席树,是一种可持久化线段树。最简单的操作就是维护静态区间第 \(k\)

主席树通过维护历史版本,实现查询区间的有关操作


主席树的原理

假设现在有这么一个序列:\(4, 1, 3, 5, 2\)

问如何求出区间 \([1,3]\) 内大小为第二的数?

利用大眼观察法,很显然是3

那么让计算机去怎么实现呢?它又没有眼睛

对于这个序列,我们可以先建一颗空的权值线段树,命名为“树 \(0\) ”(方便后面的使用),如图:

别告诉我你不知道什么是权值线段树,自己去百度;

现在序列里面第一个数是 \(4\),我们往树里面插入一个 \(4\) ,因为要保留历史版本,所以我们对 \(4\) 这个数新建一颗线段树,命名为“树 \(1\) ”,如图:

为什么是这样呢?

\(1\le 4 \le5\),故区间 \([1,5]++\);

\(4\le 4 \le5\),故区间 \([4,5]++\);

\(4\le 4 \le4\),故区间 \([4,4]++\);

其他的还是 \(0\) ;

懂了没有。。。

继续插入第二个数 \(1\) ,建成“树 \(2\) ” ,这里不解释了

再插入第三个数 \(3\),建成“树 \(3\)

OK!现在我们就已经可以求出 \([1,3]\) 内的大小为第二大的数了

递归操作查询排名应该都会吧?

不会的看这里:

  • 进入 \([1,5]\) 节点,我们发现他的左儿子的子树个数为\(2\) , $2\le k $ \((k=2)\),于是进入\([1,3]\)节点;

  • 然后我们发现 \([1,3]\) 节点的左儿子子树个数\(1 < k\) \((k=2)\),于是进入 \([3,3]\) 节点;

  • 此时我们把 \(k\) 更新为 \(1\) (\(2-1=1\));

  • 走到头了,于是就返回 \(3\) ,所以答案就是 \(3\) ,也就是原来的序列区间 \([1,3]\) 的第 \(2\) 小就是 \(3\)

现在你明白了主席树是怎么操作了的吧?


疑问

但是有一个问题:上面我们求的是区间\([1,r]\)的第 \(k\) 大的数

同理,区间 \([1,r]\) (\(r\in\) \([1,n]\) , \(r \in N\))的第 \(k\) 大数我们也就会求了

那怎么求区间 \([l,r]\) 的第 \(k\) 大数呢?

举个例子,求区间\([2,3]\)的第 \(k\) 大数

我们拿建出来的“树 \(3\) ”减掉“树 \(1\) ”后,再进行如上操作就可以了

这也就是前缀和思想

所以对于区间\([l,r]\) 我们拿“树 \(r\) ”减去“树 \((l-1)\) ”,再query一下就可以求得答案了

还有一个问题:我每个数都开一个线段树来存,空间不会炸掉吗?

所以主席树是这样操作的:

  • 每插入一个数 \(x\) ,只有 \([x,x]\)\([1,n]\) 一条链上的点会更新操作,所以我们可以共用一些点,就OK了,如图:


例题与代码

那么主席树就介绍完了,具体实现给个例题让大家看看,还有不懂得可以再参考一下他人的博客

例题:【模板】可持久化线段树1(主席树)

#include <bits/stdc++.h>
#define N (200000+5)
#define ls ch[rt][0]
#define rs ch[rt][1]
#define vl ch[vs][0]
#define vr ch[vs][1]
using namespace std;
int n,m,q;
int rt[N],ch[N<<5][2],tot,val[N<<5];//rt:每个线段树的根,ch:左右儿子,tot:编号总数,val:权值
int a[N],b[N];//a:原数组,b:离散化数组
inline int query(int x){//离散化
	return lower_bound(b+1,b+m+1,x)-b;//离散化
}
inline void update(int &rt,int vs,int l,int r,int k){//更新,新建一棵树
	rt=++tot;//新树的根节点为tot++
	ls=vl,rs=vr;//左右儿子都是历史版本的左右儿子
	val[rt]=val[vs]+1;//新加入一个数,rt的权值++
	if(l==r) return;//叶子节点,return
	int mid=(l+r)>>1;//mid为分割区间的中点
	if(k<=mid) update(ls,vl,l,mid,k);//k<=mid,k在左儿子
	else update(rs,vr,mid+1,r,k);//否则k在右儿子
}
inline int query(int rt,int vs,int l,int r,int k){//询问第k大
	if(l==r) return l;//找到了(在叶子节点),return
	int mid=(l+r)>>1;
	int v=val[vl]-val[ls];
        //这里只用算一下k在不在左儿子就行了,不再左儿子就肯定在右儿子
	//这里用当前版本减去历史版本就是类似“前缀和”操作
	if(k<=v) return query(ls,vl,l,mid,k);//在左儿子,继续找
	else return query(rs,vr,mid+1,r,k-v);//不在左儿子,找右儿子,并把k减去左边所有的个数
}
int main(){
	scanf("%d%d",&n,&q);
	for(int i=1;i<=n;i++) scanf("%d",&a[i]),b[i]=a[i];//读入
	sort(b+1,b+n+1);//离散化数组先排序
	m=unique(b+1,b+n+1)-b-1;//离散化
	for(int i=1;i<=n;i++){
		update(rt[i],rt[i-1],1,n,query(a[i]));
        //一个节点一个节点的插入;
	//这里对rt进行引用(&),相当于rt[i]=update(rt[i],rt[i-1],1,n,query(a[i]));
	}
	while(q--){
		int l,r,k;
		scanf("%d%d%d",&l,&r,&k);
		printf("%d\n",b[query(rt[l-1],rt[r],1,n,k)]);//求解静态区间第k小,注意是l-1和r
	}
	return 0;
}
posted @ 2020-01-18 11:31  Xx_queue  阅读(165)  评论(0编辑  收藏  举报