省流：本篇专供冲击NOIP一等的人使用，坐标HN

本文的洛谷链接

1.ST表&&倍增法求LCA

一对好兄弟。

1.1 ST表#

ST表是一种数据结构，不带修（悲），可以处理满足可加性与可重复贡献两条性质的区间信息

\(e.g.\)

区间最值（大/小）
位运算（按位与/或/非/异或）
区间\(\gcd\) or \(\operatorname{lcm}\)

而且码量小（小到我还是背不下来（悲）），效率高

一般来说，ST表的预处理为\(O(n\log n)\)，查询直接一个\(O(1)\)震惊\(百万OIer\)，太快了。

我们就开始学习吧！！！

首先我们要知道一个常识，如何求对数……？

先把这道题切了，并且欣赏一下我和工程大佬抢最优解的搞笑过程（？）

然后，万事开头难，我们先建个额外的\(ST[maxn]\)数组，开始啦！！

然后，我们思考如何做到这么优秀的复杂度。

一般来说，给的数据都是一维的，我们的常规思维是加点维度，让空间承担更多可以提前确定的答案，以减少单次查询的运算。那我们怎么加呢？

诶，这个时候我们就要用到一种叫倍增的思想了

朴素的查找肯定是一个个查，但是倍增就不一样了，一个不行，跳一个再找，还不对，跳两个，还不对，跳四个……还不对？！跳八个！！！（逼急了属于是，\(OIer\)做题实录）

所以一个个查肯定是查了\(O(n)\)次，而倍增可以只查\(O(\log_{2}n)\)次，\(good\)

很好的算法，~~使你不知道怎样用它减小查询次数~~

那我们就可以考虑拓展\(ST\)，把它的大小拓展\([maxn][\log_2 maxn]\)

它的第一维代表起点，第二维代表倍增查找的指数，合起来，就表示起点为\(i\)，长度为\(2^j\)这段区间的答案。

哦，真就这么简单吗？

啊，是的（

接下来就是激动人心的初始化时间了。

因为\(2^0=1\)，所以我们可以直接把原数据塞进\(ST[i][0]\)里，以\(i\)为起点，长度为\(2^0=1\)嘛

然后，我们怎么把数据填满整个表呢？

来，在纸上画一条较长的线段，把左端点涂的明显些，这就代表一个长度为\(2^j\)的区间，左端点为\(i\)。

然后再复习一个初中知识：

\[2^{j}=2 \times 2^{j-1} \]

所以最开始的区间显然可以分为两个区间：\([i,i+2^{j-1}]\)和\([i+2^{j-1}+1,i+2^{j-1}+2^{j-1}]\)，我们\([i,i+2^{j}]\)的答案就从这两个子区间转移上来，比如说最大值，答案就是两个子区间答案的最大值。

由于我们要填满整个表，填一次\(O(1)，\)所以时间就是\(O(n\log n)\)，为表的大小，\(\therefore\) 这也是空间复杂度。

好，那接下来怎么查询呢？给定区间\([l,r]\)，我们怎么\(O(1)\)搞定答案呢？

首先，由于ST表的答案存储依赖长度，我们先把区间长度\(len=r-l+1\)搞到手。然后设\(k=\log_2len\)，方便查表，没问题吧。

接下来就是重量级：

\[ans=ans(st[l][k],st[r-(1<<k)][k]) \]

其中\(ans()\)为你要求的数据的处理函数。

为什么这样可以呢？，首先，你需要读懂那个位运算，这里不做解释。我们从这个区间中的两个地方跳了\(2^k\)长度，总长度就是\(2^{log_2len}=len\)，长度是没问题的，不会遗漏。

但是，怎么保证\(l+2^k\)一定等于\(r-2^k\)呢，~~证明就不放了~~。不要慌，因为这两个值不需要相等，它们代表的是两个区间的端点，只要两个区间有交集，结果就不会错，这就是可重复贡献的好处，你可以拿最大值的例子套一套。

同样的，区间和这种东西就无法用ST表维护，因为它不能遗漏，也不能有交集，我们在ST表中不关心交集的大小，但在区间和中，被加两次是相当令人头疼的。

因为查询可以直接差分，所以就是\(O(1)\)的！

好了，讲完了，接下来把模板题切了吧！

习题1.1.1#

P3865 【模板】ST表 && RMQ问题

注意，在\(O(n\log n)\)的循环中，我们外循环是枚举长度指数，内循环则是枚举起点，和数组定义是反过来的（当然，你可以试着把数组反过来定义，可能没这么多问题，但我没试过）而且终止条件是\(i+2^j-1\le n\)，终止条件是显然的，因为你不能越界。

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;
const int log2maxn=25;
#define endl '\n'

int st[maxn][log2maxn];//第一维为数组个数，第二维为数组个数的倍增指数
int logs[maxn];

inline int query(int l,int r)
{
	int k=logs[r-l+1];

	return max(st[l][k],st[r-(1<<k)+1][k]);
}

int main()
{
	ios::sync_with_stdio(false);
	cin.tie(0);
	cout.tie(0);
	int n=0,m=0,l=0,r=0;
	cin>>n>>m;
	logs[1]=0;
	for(int i=2;i<=n;i++)
	{
		logs[i]=logs[i>>1]+1;
	}
	for(int i=1;i<=n;i++)
	{
		cin>>st[i][0];
	}
	//预处理
	for(int j=1;j<=logs[n];j++)//先枚举区间长度指数
	{
		for(int i=1;i<=n-(1<<j)+1;i++)//再枚举区间起点
		{
			st[i][j]=max(st[i][j-1],st[i+(1<<(j-1))][j-1]);
		}
	}
	for(int i=1;i<=m;i++)
	{
		cin>>l>>r;
		cout<<query(l,r);
		if(i<m)cout<<endl;
	}
	return 0;
}

好了，学会了这个~~有用但不是很有用的~~数据结构，我们来看它的一个重要应用。

1.2 倍增法求LCA#

本文不涉及\(tarjan\)法，因为€€￡的官方教材上估计是觉得CSP 2022 T3级别的数据\(tarjan\)都过不去，所以写了一句“实际中几乎完全被取代”。难绷。

LCA是最近公共祖先的英文缩写（废话），指的是树中的两个节点的最近的（距离最小的）公共祖先。比如说，你和你的兄弟姐妹的LCA肯定是爸爸妈妈，~~但是别的情况我们不涉及（~~

特别的，如果两个点本身就是一条脉上的，即某个点是另外一个点的祖先，我们规定这两个点的LCA为深度最小的那个点，这跟\(\gcd(2,4)=2，\operatorname{lcm}(2,4)=4\)是一个道理。

好，那怎么求出同一棵树上任两个节点的LCA呢？

一个暴力的想法马上就可以写出来，用两个变量当“指针”，指着这两个点，然后依次跳到它们的父亲，一直到这两个指针指到相同节点为止。这个相同节点就是所求的LCA。

由于我们需要一直往上跳，遍历的节点很多，对于\(n\)个结点的树进行\(q\)次询问的话，暴力做法的复杂度达到了\(O(nq)\)，很多题目都无法承受。

那么有什么优化的方法吗？答案是肯定的，我给你在上面暴力流程中画一下关键词：

依次跳到它们的父亲

看到了吧，跟我们之前讲的“一个个查”很类似，那我们也可以异想天开，看看这种树上查询能不能用ST表搞定。

这一回，我们的ST表有实际意义了。对于每个\(st[i][j]\)，它表示：从节点\(i\)向上跳\(2^j\)层所到达的节点。我们这里做个约定，由于储存内容是下表的父亲，我们把\(st\)暂时改名叫\(fa\)，之前写ST表的对数表用来给节点储存深度，改叫\(dep\)。其余不变。

首先搞定\(fa\)的初始化，由于这不是线性结构的问题了，我们在树上的预处理受到树节点连边的限制。所以，我们把预处理放进树的\(dfs()\)

我们首先把传入节点的\(dep\)初始化为它父亲的+1，然后，它往上跳一层便是它的父亲，所以把\(fa[传入节点][0]\)初始化为它的父亲节点编号。

接下来，我们一直往上跳，直到跳到深度限制（对，就是这么夸张），但是我们肯定不能一个一个跳，我们是枚举指数，就像初始化ST表那样。那么，我们怎么做呢？\(fa[x][i]\)有什么规律呢？

我们再回到那个初中等式：

\[2^{j}=2 \times 2^{j-1} \]

有没有什么启发？直接看这个式子显然没有。

但是呢，我们可以将“从起点\(i\)跳\(2^j\)层”这个过程分成两步，先从\(i\)跳\(2^{j-1}\)层，再从新起点跳\(2^{j-1}\)层。这样，我们就跳了\(2\times 2^{j-1}=2^{j}\)层。成功把这个过程等价了。

如果你还没什么感触的话，你应该想到一个式子：

\[fa[u][i]=fa[fa[u][i-1]][i-1] \]

其中，\(u\)是最开始的节点。

这下就明白怎么向上更新了吧？但是……请问我们到现在为止，干的事情……跟\(dfs()\)有什么关系？

好吧，为了在形式上更像\(dfs()\)，我们来考虑一下转移问题。

……还能怎么转移？考虑完了自己的爹，肯定要考虑自己的子孙后代的爹了！（~~无隐喻~~）

我们就遍历传入节点的子孙，但是如果你加的是双向边的话，那你就很麻烦，因为搞不好判儿子的时候会指父为子，哦，不敢想象……

我们就判定，对于点\(i\)的某条边，如果它指向的不是父亲节点，就以这条边的另一个端点作为传入节点，它的父亲节点就是\(i\)。顺便说一句，父亲节点也是在\(dfs()\)的形参列表里传进去的。

好，这样我们就完成了每个点的初始化，\(n\)个点跳了\(\log_2 n\)的高度，总时间复杂度为\(O(n\log_2 n)\)，刚好和ST表的预处理一致。

接下来查询，也没什么别的，就是让\(dep\)大的那个点一路往上跳，这里的跳是\(fa[u][i]\)。然后当两个点\(dep\)一致的时候，就一起跳，只是它们俩的跳这下可以基于ST表（\(fa\)），越跳越高，乐。当跳到两个节点的\(fa\)相同时，就不跳了。

然后，我们返回其中一个节点的\(fa[u][0]\)，既然它们的父亲相同了，那再跳一步就到了嘛。

如果第一阶段的单独跳结束后，两个指针刚好重合，那就说明它们在一条脉上，由于已经跳完了，这时返回任意一个节点都可以。记得在一起跳之前判掉。

这样做，你需要\(O(n\log_2 n)\)的预处理，\(q\)次查询，每次最多查\(\log_2 n\)个点，那么查询就是\(O(q\log_2 n)\)，总的就是\(O((n+q)\log_2 n)\)可能会超时，但是对于我们的目标要求已经够用了

好了，模板题来袭！！！

习题1.2.1#

P3379 【模板】最近公共祖先（LCA）

本题用了邻接表存树，你用链式前向星也可以。

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e7;
const int log2maxn=25;
#define endl '\n'

vector<int> tree[maxn];
int fa[maxn][30];
int dep[maxn];

inline void adde(int u,int v)
{
	tree[u].push_back(v);
}

void dfs(int u,int father)
{
	dep[u]=dep[father]+1;
	fa[u][0]=father;
	for(int i=1;i<=log2maxn;i++)
	{
		fa[u][i]=fa[fa[u][i-1]][i-1];
	}
	for(int i=0;i<tree[u].size();i++)
	{
		if(tree[u][i]!=father)dfs(tree[u][i],u);
	}
}

int lca(int u,int v)
{
	if(dep[u]<dep[v])
	{
		swap(u,v);
	}
	for(int i=log2maxn;i>=0;i--)
	{
		if(dep[fa[u][i]]>=dep[v])
		{
			u=fa[u][i];
		}
	}
	if(u==v)return v;
	for(int i=log2maxn;i>=0;i--)
	{
		if(fa[u][i]!=fa[v][i])
		{
			u=fa[u][i];
			v=fa[v][i];
		}
	}
	return fa[u][0];
}

int main()
{
	ios::sync_with_stdio(false);
	cin.tie(0);
	cout.tie(0);
	int n=0,m=0,root=0,u=0,v=0,l=0,r=0;
	cin>>n>>m>>root;
	for(int i=1;i<=n-1;i++)
	{
		cin>>u>>v;
		adde(u,v);
		adde(v,u);
	}
	dfs(root,0);
	for(int i=1;i<=m;i++)
	{
		cin>>l>>r;
		cout<<lca(l,r);
		if(i<m)cout<<endl;
	}
	return 0;
}

2. 线段树

众所周知，ST表虽然能上树，但是它终究是个静态的东西，不带修让人很难受，我们现在就开始学习一种OIer根本无法绕开不学的数据结构——线段树！！！（Segment Tree，SGT），它支持动态修改和点查/区查，并且全是\(O(\log_2 n)\)级别的，相当的快啊。

而且还有很多变种：

按值域分的权值线段树
区间第k小的可持久化线段树（主席树）
看上去好像是计算几何的李超线段树
卡常大师\(zkw\)线段树
解决区间历史问题的吉司机线段树
线段树~~从隔壁平衡树学的~~的合并与分裂
在树套树的战场共襄盛举

但是这些东西本文基本上都不学……

权值线段树会讲，\(zkw\)本来想讲，但是发现没必要（

我们省选再见好吧。

2.1 普通线段树#

线段树确实是树形的，但是它维护的还是一个线性序列的信息，它的节点事实上是维护一个区间的信息。

所以，我们可以从根节点开始，一步步递归，分治，把每个节点所代表的区间端点传递下去。为什么可以递归呢？这里引入一个小结论，我们暂时不予证明：

对于一棵二叉树，节点\(x\)的左儿子为\(2x\)，右儿子为\(2x+1\)，写成位运算的形式为\(x<<1\)和\((x<<1)|1\)

做了这么多题，你应该对下表和信息存储之间的关系有些想法了。现在让我们来看看具体怎么递归。

首先，我们把信息读入原线性数组\(arr\)，设其长度为\(n\)，然后进行线段树的初始化。根节点所代表的区间自然是\([1,n]\)，如果没有到叶子节点，我们就别停，设当前传递到了区间\([l,r]\)，我们取\(mid=\lfloor \frac{l+r}{2}\rfloor\)，以\([l,mid]\)和\([mid+1,r]\)两个区间分别递归。

哦，什么时候停呢，不是叶子节点就递归，那是叶子节点就停呗！什么节点算叶子节点呢？当然是分无可分的时候，即\(l==r\)，分不出来了。这个时候，我们就设\(tree[pos]=arr[l]\)，代表\([l,l]\)，当然就是\(arr[l]\)嘛！其中\(pos\)为当前递归位置，也可以认为是当前节点个数，不过就不利于理解下面的知识了（

当然，在递归建树完成后，我们还要进行一些小操作，每个节点既然代表了区间信息，那我们总得把信息拉到上面的节点来吧，不能沉在底下的叶子吧，你在ST表那里也干了这种活。

比如说区间和，我们可以直接把节点\(i\)的左右儿子的答案加在一起，作为节点\(i\)的答案。为什么呢？有没有发现，我们递归建树时，刚好把\([l,r]\)对半切开，无缝分成两个儿子所代表的区间？所以我们统计该节点的答案时，只要把它儿子们的答案相加就可以了。我们把这个操作叫做\(pushup()\)，很形象吧，把底下的答案拉上去。

在每个节点的两个儿子的递归都跑完了后，我们就把答案\(pushup()\)上来，如果有目的的话，就是方便查询）

初始化完了，我们来讨论区修和区查，单点就是特殊情况嘛。

首先谈谈区间修改，我们怎么做呢，就是把待修改区间传递下去，对于每个节点\(i\)，如果它所代表的区间能够被我们所要修改的区间包括的话，那我们肯定传到足够小的区间了，把这个节点的答案更新，然后直接返回，跑。

不然的话，那就说明区间还分的不够小，我们取熟悉的\(mid\)，但是是这个节点的左右端点。然后判断一下，如果传入的左端点在中间值左边，那就说明在这个节点代表区间的左半边有贡献，左半边怎么表示？左儿子嘛！同理，右端点比中间值大的话，右半边就也需更改，就是右儿子嘛！最后改完了，别忘了\(pushup()\)

查询也是很简单，在修改的基础上改一下：

如果传入区间大于等于该节点区间，那就查到头了，直接将该节点的内容返回即可。
不然再计算一下该区间的\(mid\)，传入区间的左端点小的话，就去统计左儿子的贡献，右端点比\(mid\)大的话，就统计右儿子的贡献
最后返回答案就可以了，不需要\(pushup()\)

关于这些区间左右儿子，怎么体现呢？在修改和查询的函数里都加个\(pos\)参数，直接传儿子编号就行了，和初始化一样。最初调用时，我们赋1就可以，从根开始搜嘛。

这就是线段树的基本操作了，下面先来写道模板题。

习题2.1.1#

P3372 【模板】线段树 1

首先，线段树的数组要开4倍空间，严谨证明？~~从没给过好吧~~。

这里再了解一个知识：懒标记（lazytag）

说是能延迟修改，但是我没看出来（

反正如果要继续向下修改/查询的话，就要把左右儿子的懒标记加上父亲的，同时改掉左右儿子的答案，最后把父亲的懒标记清空（传下去了，不要了）。这个操作叫\(pushdown()\)，就是把懒标记传下去。这个如果改到了叶子，那就直接加上懒标记就行了。

好了，你已经了解完了，可以先试试，我没有能力搞来好图片演示，靠干讲实在不太行。可以对着我的代码调（

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+7;
#define int long long

int arr[maxn];
struct node
{
	int l;
	int r;
	int sum;
	int lazy;
};
node tree[maxn*4];

inline int lson(int pos)
{
	return pos<<1;
}

inline int rson(int pos)
{
	return (pos<<1)|1;
}

inline void pushup(int pos)
{
	tree[pos].sum=tree[lson(pos)].sum+tree[rson(pos)].sum;
}

inline void pushdown(int pos)
{
	if(tree[pos].lazy!=0)
	{
		tree[lson(pos)].lazy+=tree[pos].lazy;
		tree[rson(pos)].lazy+=tree[pos].lazy;
		tree[lson(pos)].sum+=tree[pos].lazy*(tree[lson(pos)].r-tree[lson(pos)].l+1);
		tree[rson(pos)].sum+=tree[pos].lazy*(tree[rson(pos)].r-tree[rson(pos)].l+1);
		tree[pos].lazy=0;
	}
}

void build(int pos,int l,int r)
{
	tree[pos].l=l;
	tree[pos].r=r;
	tree[pos].lazy=0;
	if(l==r)
	{
		tree[pos].sum=arr[l];
		return;
	}
	int mid=(l+r)>>1;
	build(lson(pos),l,mid);
	build(rson(pos),mid+1,r);
	pushup(pos);
	return;
}

int query(int L,int R,int pos)
{
	if(tree[pos].l>=L&&tree[pos].r<=R)
	{
		return tree[pos].sum;
	}
	pushdown(pos);
	int mid=(tree[pos].l+tree[pos].r)>>1;
	int sum=0;
	if(L<=mid)sum+=query(L,R,lson(pos));
	if(R>mid)sum+=query(L,R,rson(pos));
	return sum;
}

void update(int L,int R,int pos,int val)
{
	if(tree[pos].l>=L&&tree[pos].r<=R)
	{
		tree[pos].sum+=val*(tree[pos].r-tree[pos].l+1);
		tree[pos].lazy+=val;
		return;
	}
	else
	{
		pushdown(pos);
		int mid=(tree[pos].l+tree[pos].r)>>1;
		if(L<=mid)update(L,R,lson(pos),val);
		if(R>mid)update(L,R,rson(pos),val);
		pushup(pos);
	}
}

signed main()
{
	int n=0,m=0,op=0,x=0,y=0,k=0;
	cin>>n>>m;
	for(int i=1;i<=n;i++)
	{
		cin>>arr[i];
	}
	build(1,1,n);
	for(int i=1;i<=m;i++)
	{
		cin>>op>>x>>y;
		if(op==1)
		{
			cin>>k;
			update(x,y,1,k);
		}
		else
		{
			cout<<query(x,y,1);
			if(i<m)cout<<endl;
		}
	}
	return 0;
}

习题2.1.2#

P3373 【模板】线段树 2

这里有两个懒标记~~那就开两个呗（~~，传递时改区间答案，记得先乘上乘法的lztag，再加上加法的。主要是为了符合运算律。主要是加法tag更新时要乘上乘法的tag，这一点很麻烦。可以像下面一样写个专门的函数计算。

而且乘法懒标记要赋为\(1\)！赋\(0\)就改不动了！

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+7;
#define int long long

int arr[maxn];
struct node
{
	int l;
	int r;
	int sum;
	int add;
	int mul;
};
node tree[maxn*4];

inline int lson(int pos)
{
	return pos<<1;
}

inline int rson(int pos)
{
	return (pos<<1)|1;
}

inline void calc(int pos,int add,int mul,int mod)
{
	tree[pos].sum=(tree[pos].sum*mul+(add*(tree[pos].r-tree[pos].l+1)))%mod;
	tree[pos].mul=(mul*tree[pos].mul)%mod;
	tree[pos].add=(tree[pos].add*mul+add)%mod;
}

inline void pushup(int pos)
{
	tree[pos].sum=tree[lson(pos)].sum+tree[rson(pos)].sum;
}

inline void pushdown(int pos,int mod)
{
	calc(lson(pos),tree[pos].add,tree[pos].mul,mod);
	calc(rson(pos),tree[pos].add,tree[pos].mul,mod);
	tree[pos].add=0;
	tree[pos].mul=1;
}

void build(int pos,int l,int r)
{
	tree[pos].l=l;
	tree[pos].r=r;
	tree[pos].add=0;
	tree[pos].mul=1;
	if(l==r)
	{
		tree[pos].sum=arr[l];
		return;
	}
	int mid=(l+r)>>1;
	build(lson(pos),l,mid);
	build(rson(pos),mid+1,r);
	pushup(pos);
	return;
}

int query(int L,int R,int pos,int mod)
{
	if(tree[pos].l>=L&&tree[pos].r<=R)
	{
		return tree[pos].sum;
	}
	pushdown(pos,mod);
	int mid=(tree[pos].l+tree[pos].r)>>1;
	int sum=0;
	if(L<=mid)sum+=query(L,R,lson(pos),mod)%mod;
	if(R>mid)sum+=query(L,R,rson(pos),mod)%mod;
	return sum;
}

void update(int L,int R,int pos,int add,int mul,int mod)
{
	if(tree[pos].l>=L&&tree[pos].r<=R)
	{
		calc(pos,add,mul,mod);
		return;
	}
	else
	{
		pushdown(pos,mod);
		int mid=(tree[pos].l+tree[pos].r)>>1;
		if(L<=mid)update(L,R,lson(pos),add,mul,mod);
		if(R>mid)update(L,R,rson(pos),add,mul,mod);
		pushup(pos);
	}
}

signed main()
{
	int n=0,m=0,mod=0,op=0,x=0,y=0,k=0;
	cin>>n>>m>>mod;
	for(int i=1;i<=n;i++)
	{
		cin>>arr[i];
	}
	build(1,1,n);
	for(int i=1;i<=m;i++)
	{
		cin>>op>>x>>y;
		if(op==1)
		{
			cin>>k;
			update(x,y,1,0,k,mod);
		}
		else if(op==2)
		{
			cin>>k;
			update(x,y,1,k,1,mod);
		}
		else
		{
			cout<<query(x,y,1,mod)%mod;
			if(i<m)cout<<endl;
		}
	}
	return 0;
}

习题2.1.3#

P8856 [POI2002]火车线路

来看一道线段树的初级应用，这里也讲解一下，线段树如何解RMQ问题。

思路很简单，把时间轴看成是原线性数组，初始每个元素都为\(s\)，，然后初始化。每次查询在这段时间里的座位数的最小值，如果大于需要的座位，那就可以买，整段区间减掉座位，不然就不可以总司令（

用线段树求这种动态RMQ问题和求区间和有什么区别呢？

……

没有什么区别（

\(pushup()\)里的加和改成\(\min\) or \(\max\)
查询函数里的累加改成\(\min\) or \(\max\)

结束。额……确实只有这种区别（

哦，数据表明，到第\(D\)天，人家下车了，不占座位了，所以所有查询和修改的区间都应为\([O,D)\) or \([O,D-1]\)

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;

struct node
{
	int l;
	int r;
	int val;
	int lazy;
};
node tree[maxn*4];

inline int lson(int pos)
{
	return pos<<1;
}

inline int rson(int pos)
{
	return (pos<<1)|1;
}

inline void pushup(int pos)
{
	tree[pos].val=min(tree[lson(pos)].val,tree[rson(pos)].val);
}

inline void pushdown(int pos)
{
	if(tree[pos].lazy)
	{
		tree[lson(pos)].lazy+=tree[pos].lazy;
		tree[rson(pos)].lazy+=tree[pos].lazy;
		tree[lson(pos)].val+=tree[pos].lazy;
		tree[rson(pos)].val+=tree[pos].lazy;
		tree[pos].lazy=0;
	}
}

void build(int pos,int l,int r,int s)
{
	tree[pos].l=l;
	tree[pos].r=r;
	tree[pos].lazy=0;
	if(l==r)
	{
		tree[pos].val=s;
		return;
	}
	int mid=(l+r)>>1;
	build(lson(pos),l,mid,s);
	build(rson(pos),mid+1,r,s);
	pushup(pos);
	return;
}

void change(int pos,int l,int r,int val)
{
	if(tree[pos].l>=l&&tree[pos].r<=r)
	{
		tree[pos].val+=val;
		tree[pos].lazy+=val;
		return;
	}
	else
	{
		pushdown(pos);
		int mid=(tree[pos].l+tree[pos].r)>>1;
		if(l<=mid)change(lson(pos),l,r,val);
		if(r>mid)change(rson(pos),l,r,val);
		pushup(pos);
	}
}

int query(int pos,int l,int r)
{
	if(tree[pos].l>=l&&tree[pos].r<=r)
	{
		return tree[pos].val;
	}
	pushdown(pos);
	int mid=(tree[pos].l+tree[pos].r)>>1;
	int res=0x3f3f3f3f;
	if(l<=mid)res=min(query(lson(pos),l,r),res);
	if(r>mid)res=min(query(rson(pos),l,r),res);
	return res;
}

int main()
{
	int n=0,num=0,m=0,l=0,r=0,k=0;
	cin>>n>>num>>m;
	build(1,1,n,num);
	for(int i=1;i<=m;i++)
	{
		cin>>l>>r>>k;
		if(query(1,l,r-1)>=k)
		{
			cout<<"T";
			change(1,l,r-1,-k);
		}
		else cout<<"N";
		if(i<m)cout<<endl;
	}
	return 0;
}

比分块来说，SGT可能更优，但也更容易被卡（，而且确实没有分块好写。

2.2 权值线段树#

权值线段树肯定是沿袭了线段树的基本框架，但是原线性数组已被确定为题目所给值域，所以不用初始化了。

所以我们\(tree\)数组就可以确定为\(int\)类型，表示每个数值出现的次数，当然你硬是要用\(node\)类型也可以，但值域不大，不用优化时，我们显然可以偷懒，直接写成\(int\)，降低编码难度。

如果不用初始化，那我们修改和查询的区间传什么呢？你……肯定是在整个线性数组范围内查找啊，之前线段树是\([1,n]\)，那我们现在变成以值域作为线性数组，那最初传入的区间就是值域嘛！即\([-maxn,maxn]\)。如果题目中没有给负数，那就\([0,maxn]\)，如果0也不给，那你照着写呗，总不能都是我给结论吧（

好，接下来我们了解一下权值线段树的功能：

插入/删除一个数

相当于在线性数组上加减一个数，出现次数\(\pm 1\)嘛

查询这个数在全局范围内多大

比它小的数有多少个，加上它自己1个。

查询现在第\(k\)小的数

因为线段树的每个叶子都是线性序列上的节点，所以我们只要找到第\(k\)小的叶子就可以了。

区间第\(k\)小请转向主席树 or 树套树

查全局前驱后继

查查自己多大，再查查自己前后面是谁，搞定。

现在我们来一步步实现这些操作。

首先，把前面线段树的修改函数先拷过来。然后\(l==r\)的那个判叶子代码改成tree[pos]++或tree[pos]--，就表示我们在这个位置添加或者删除一个数了，\(pushup()\)还是要的，毕竟还要把每个区间的数据逐级拉上来。

我们的\(mid\)取传入区间的中间值，如果我们要修改的数比中间值小，显然要找左儿子，否则就找右儿子。

关于查询第\(k\)小的数呢，我们直接以\(k\)为基础判断，对于当前节点，如果\(k\)小于等于它的左边界，那不行，找找左儿子，显然传这个区间的一半作为值域，\(mid\)是老朋友了。不然的话，就说明整个左子树都小于\(k\)，那么我们就找右子树，但是右子树要减掉左子树的大小，因为左子树占了名额嘛。如果找到合适的叶子了，我们就返回叶子的边界（也就是第\(k\)小的数嘛）

那么，我们怎么进行这个逆操作，即查询一个数是多大呢？先把刚写的第\(k\)小拷过来，然后略作改动。具体就是如果这个数小于我们的老朋友\(mid\)，那就查左子树，反之，就查它在右子树中的排名，然后加上左子树的大小，左子树也占了名额嘛。

有了这两个互逆操作，我们查前驱后继就简单多了，首先，看看自己要传入的数是第几小，然后再查第（几-1）或（几+1）的数就可以了。

事实上，这几个功能跟我们接下来要讲的平衡树极为接近，所以我们可以找平衡树的板子来练习权值线段树。

习题2.2.1#

P3369 【模板】普通平衡树

当你学了平衡树后，你肯定会觉得还是权值线段树好写，而且平衡树不一定能跑得比权值线段树快，只是权值线段树的区间比较大（虽然也没看到题目卡），比如说本题的值域就为\(\pm 1e7\)，加上线段树的四倍空间，我们可以把数组开到\(8 \times 10^7\)，要通过本题很有点困难，我们来介绍权值线段树（其实普通线段树也可以）的一种空间优化：动态开点。

什么是动态开点呢？我们给线段树开四倍空间，这些空间不管你用不用都要开在那里，很没必要。动态开点就是需要修改（在权值线段树里体现在添加或删除一个数）时才开这个点，如果有数从来没出现过，我们就不开这个点了，这样就可以把实际空间节省到点数\(\times 4\)，当然你开4倍空间时还是要写\(1e7\)这个值域的。

区别主要体现在插入和删除上，我们设一个变量\(root\)表示根节点并赋0，将传入的pos改为引用传递（在函数里的修改是改你传进来的变量，所以不能传一个数），然后先把pos传进去。再设一个\(tot\)表示总点数。

在添删的操作里，如果传入的pos为空，那我们就直接把\(tot\)加一，然后把root赋成新的tot。因为传进来的都是左右儿子，如果他们为空，那肯定要新加点。

加了动态开点以后，节点的左右边界会变得不确定（因为省了一些点），建议直接开个结构体存着。这里的root是传了个引用，一开始赋成0，后面会自动改的，即根节点的编号。

然后就没了，没了？没了。

下面没给朴素写法（朴素写法又不是AC Code），直接加了动态开点，以供对照。

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;//询问数
const int maxn2=1e7+5;//值域

int tree[maxn*4];//每个节点储存内容
struct interval
{
	int l;
	int r;
};
interval node[maxn*4];//每个点所代表的边界
int tot=0;//点数

inline void pushup(int pos)
{
	tree[pos]=tree[node[pos].l]+tree[node[pos].r];
}

void ins(int &pos,int l,int r,int val)//插入
{
	if(!pos)pos=++tot;//新增一个点
	if(l==r)//只有叶子值域才会缩成一个点
	{
		tree[pos]++;//rp++
		return;//要是不返回你就死定了
	}
	int mid=(l+r)>>1;//二分
	if(val<=mid)ins(node[pos].l,l,mid,val);//插入的数比当前节点代表的区间的中间值还小，那就往左边找
	else ins(node[pos].r,mid+1,r,val);//要不还是往右边找吧
	pushup(pos);//别忘了把这个数汇报给上级
}

void del(int &pos,int l,int r,int val)//删除，和插入基本一致
{
	if(!pos)pos=--tot;//关于这个点，它死了。别忘了把这个点销户
	if(l==r)
	{
		tree[pos]--;
		return;
	}
	int mid=(l+r)>>1;
	if(val<=mid)del(node[pos].l,l,mid,val);
	else del(node[pos].r,mid+1,r,val);
	pushup(pos);
}

int kth(int pos,int l,int r,int k)//全局第k个
{
	if(l==r)return l;//找到合适的叶子了，很明显叶子的边界就是排名
	int mid=(l+r)>>1;//二分again
	if(k<=tree[node[pos].l])return kth(node[pos].l,l,mid,k);//你要找的数在左子树上
	else return kth(node[pos].r,mid+1,r,k-tree[node[pos].l]);//你要找的数在右子树上，同时，左子树占了名额，把它们都减去
}

int getrank(int pos,int l,int r,int val)//全局排名查询
{
	if(l==r)return 1;//找到了！
	int mid=(l+r)>>1;//二分again again
	if(val<=mid)return getrank(node[pos].l,l,mid,val);//去左边那桌
	else return getrank(node[pos].r,mid+1,r,val)+tree[node[pos].l];//去右边那桌，记得把左边的名额带过来
}

int main()
{
	int n=0,op=0,x=0,root=0;
	cin>>n;
	for(int i=1;i<=n;i++)
	{
		cin>>op>>x;
		if(op==1)
		{
			ins(root,-maxn2,maxn2,x);
		}
		if(op==2)
		{
			del(root,-maxn2,maxn2,x);
		}
		if(op==3)
		{
			cout<<getrank(root,-maxn2,maxn2,x);
			if(i<n)cout<<endl;
		}
		if(op==4)
		{
			cout<<kth(root,-maxn2,maxn2,x);
			if(i<n)cout<<endl;
		}
		if(op==5)
		{
			int num=getrank(root,-maxn2,maxn2,x);//前驱肯定是第k-1个数
			cout<<kth(root,-maxn2,maxn2,num-1);
			if(i<n)cout<<endl;
		}
		if(op==6)
		{
			int num=getrank(root,-maxn2,maxn2,x+1);//后继肯定是第k+1个数
			cout<<kth(root,-maxn2,maxn2,num);
			if(i<n)cout<<endl;
		}
	}
	return 0;
}

2.3 树状数组#

学了线段树，你可能会被它的码量深深折服（

其实它还有种码量小的对手（当然实际应用中不是这么回事），叫树状数组

二者的思维比较相近，都是把线性结构转为树形结构。但

树状数组的额外数组不需要开四倍空间，而只有一倍空间
能够做到和线段树一样的修改与查询的时间复杂度，即\(O(\log_2 n)\)，相当优秀。
当然，它的拓展性极差，而且区间修改和区间查询放到一起就会极麻烦，所以我们就不讲这种情况了（

它是怎么做到的呢？这个问题比较抽象。简单来说，它删掉了一棵普通的二叉树的一些节点，与线段树一样，原数组沉在最底下，然后上面的辅助节点的编号进行二进制展开后最后面的1屁股后面的零坨一样多，零坨越多，转化成树的深度越浅。

似乎很抽象，我们举个例子，假设原数组长度为\(8\)

然后我们把1-8展开成二进制：

\[\begin{aligned} 1=000\color{#66CCFF}{1}\\ 2=00\color{#EE0000}{10}\\ 3=001\color{#66CCFF}{1}\\ 4=0\color{#006666}{100}\\ 5=010\color{#66CCFF}{1}\\ 6=01\color{#EE0000}{10}\\ 7=011\color{#66CCFF}{1}\\ 8=1000 \end{aligned} \]

容易发现，相同颜色标记的数字都满足这个特点。所以，对有\(8\)个元素的数组，我们构建树状数组后，应该是如下结构：

第一层：\(tree[8]\)
第二层：\(tree[4]\)
第三层：\(tree[2],tree[6]\)
第四层：\(tree[1],tree[3],tree[5],tree[7]\)
第五层：原数组。

每层有什么节点清楚了……清楚了吗？\(n\)个节点都这么推吗？，如何让计算机去数最后面的零坨？

我们在这里介绍一种运算：\(lowbit()\)

首先我们先给待求数按位取反，然后+1，由计算机基本原理可知，这个操作相当于直接取负，所以不要怕实现复杂。

然后，我们拿着这个数和原数进行按位与，C++就一个&，我们不管了。

比如说\(6\)，我们展示它有内容的字节（int有四个字节嘛），演示一下这个过程：

原数：\(00000110\)
按位取反：\(11111001\)
加一：\(11111010\)
按位与：

\[\begin{aligned} 原数：00000110\\ 变换：11111010\\ 结果：00000010 \end{aligned} \]

你看，是不是就拿到了一个数最后一个1和后面的零坨？

数学证明就不要深究了……whk数学能拿多少分，还能看得懂这种证明。（（无恶意）

我们就规定，树状数组\(tree[i]\)储存的是原数组的右端点为\(i\)的信息。

？？？

那左端点呢？\(1\)吗？nonono，~~那跟前缀和数组还有什么区别~~

我们又在这里定义，\(tree[i]\)的所储存的区间的长度是\(lowbit(i)\)，这样的话，手模一下上面的例子，\(tree[i]\)的元素各自存储的区间为：

\[\begin{aligned} tree[1]=[1,1]\\ tree[2]=[1,2]\\ tree[3]=[3,3]\\ tree[4]=[1,4]\\ tree[5]=[5,5]\\ tree[6]=[5,6]\\ tree[7]=[7,7]\\ tree[8]=[1,8] \end{aligned} \]

然后呢？这么规定有什么用？

别急啊，首先，我们思考一下线段树的几个功能

因为前面说了区修区查一起搞很复杂，所以，我们分点修+区查和区修+点查两种情况来讨论。

点修+区查

我们考虑对单点进行修改，比如说，我们改\(arr[1]\)，那跟\(tree\)数组有什么关系呢？一看先前的表，哦，\(tree[1],tree[2],tree[4],tree[8]\)都涉及到了\(arr[1]\)这个位置，那都要改咯。

但是每一个点都会牵扯到这么多区间吗？我们怎么进行\(tree[i]\)更改的转移呢？

我们研究\(1,2,4,8\)这四个数的关系，这时，我们就请出我们的利器\(lowbit()\)，既然都说了有关系，先拿它试试呗：

\[\begin{aligned} lowbit(1)=1\\ lowbit(2)=2\\ lowbit(4)=4 \end{aligned} \]

哦，似乎有点好玩的事情。

\[\begin{aligned} 1+lowbit(1)=2\\ 2+lowbit(2)=4\\ 4+lowbit(4)=8 \end{aligned} \]

哦！我们在线段树里就发现了，深度越浅的节点区间越大，所以当修改了一个点时，我们要把它的修改值传上去，就可以一直给它的下标\(+lowbit(它的编号)\)，这样做可以不重不漏，好耶！

但这只是个孤证啊！没事，我们再改个\(arr[5]\)，查表，先改\(tree[5]\)，加个\(lowbit(5)=1\)，转移到了\(tree[6]\)，再加个\(lowbit(6)=2\)，就到了\(tree[8]\)了！可以证明没有哪个包含\(arr[5]\)的区间被落下。

那就这样了，假如我们要修改\(arr[i]\)，我们只要修改它对应的\(tree[i]\)，然后一路加\(lowbit()\)转移，转移一次修改一次，直到\(tree[n]\)修改完成，因为\(tree[n]\)代表了\([1,n]\)，这肯定是最大的，所以不用再修改了。我们就退出。

那区间查询呢？好像有点不方便。比如我们要查询\([1,6]\)，查表，可以直接返回\(tree[4]+tree[6]\)，那查询\([3,6]\)呢？不行了吧。

但是我们可以观察到，查找\([1,i]\)这个区间，基本上就是修改的逆操作，我们可以直接减减减\(lowbit()\),减到\(tree[1]\)打止。

那我们有一个构想，对于可差分的信息，比如区间和，\([l,r]\)的答案显然就是\([1,r]\)的答案减去\([1,l-1]\)的答案,那么我们只要查询两次，再把答案相减就可以了，那么不可差分的信息怎么维护？对不起，不好搞，对于我们无法解决的问题，我们就把它扔进限制条件，让后世\(OIer\)们受苦吧）

当然，存在一种\(O(\log^2n)\)（对你没看错）的做法可以这么做，但我们用不上，所以鸽了，咕咕咕。

由于这种模式下查询时\(tree\)下标往前走，修改时往后走，我们可以记成“向前查，向后修”

习题2.3.1#

P3374 【模板】树状数组 1

本题为\(div.\)点修+区查

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=5e5+7;

int treearr[maxn];

inline int lowbit(int x)
{
	return x&-x;
}

void change(int n,int pos,int val)
{
	while(pos<=n)
	{
		treearr[pos]+=val;
		pos+=lowbit(pos);
	}
}

int query(int pos)
{
	int t=0;
	while(pos>0)
	{
		t+=treearr[pos];
		pos-=lowbit(pos);
	}
	return t;
}

int main()
{
	int n=0,m=0,buf=0,op=0,x=0,val=0,l=0,r=0;
	cin>>n>>m;
	for(int i=1;i<=n;i++)
	{
		cin>>buf;
		change(n,i,buf);
	}
	for(int i=1;i<=m;i++)
	{
		cin>>op;
		if(op==1)
		{
			cin>>x>>val;
			change(n,x,val);
		}
		else
		{
			cin>>l>>r;
			cout<<query(r)-query(l-1);
			if(i<m)cout<<endl;
		}
		
	}
	return 0;
}

区修+点查

我们前面点查修改一次要从树上爬下去，是\(O(\log_2 n)\)的。如果暴力扫的话会是\(O(n\log_2 n)\)，题目受不住。

我在这时看了一眼自己的代码……所以为什么要暴力扫？

我们在区间查询时提到了两点：

一次查询，查的是\([1,i]\)

查询和修改刚好方向相反

那么，我们也可以发现，区修实质上可以沿用点修的函数，点修影响了包含这个点的区间，可以认为，在它修改的区间内，最大的是\([i,n]\)（虽然实际上没有改这么多）如果这些区间中有的不能改，我们可以把它改回来就是了。

我们试试这个猜想，对于区间\([3,5]\)，我们修改一下\(3\)：

\[ 改tree[3]，即[3,3]\\ lowbit(3)=1，3+1=4\\ 改tree[4]，即[1,4]\\ lowbit[4]=4，4+4=8\\ 改tree[8]，即[1,8] \]

我们发现，实质上，你可以认为修改对\([3,8]\)都产生了影响，但我们只要修改\([3,5]\)，所以应该把\([6,8]\)的影响抵消掉

怎么做？不难发现，以\(6\)为起点，数值相反，再做一次区修嘛！\(6\)是甚么？右端点\(5\)再加一嘛！

好，因为只爬了两次，我们依然只有\(O(\log_2 n)\)。

我们居然把\(O(n\log_2 n)\)打成了\(O(\log_2 n)\)，整整一个\(n\)啊！这就是算法的力量！

接下来是最后一关了！点查怎么写？

由于树状数组区修区查奇怪的不相容性质，搭配区修，点查也爬两次会出现一点小错误~~怎么都算不对~~。我们在这种情况下读入数据时应直接把数据读入原数组\(arr\)，然后点查\(i\)结果就是给\(i\)的区查函数的结果加上\(arr[i]\)。原理我们不予证明，因为树状数组此时的性质已经变为了差分数组。

习题2.3.2#

P3368 【模板】树状数组 2

本题为\(div.\)区修+点查

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=5e5+7;

int treearr[maxn];
int arr[maxn];

inline int lowbit(int x)
{
	return x&-x;
}

void change(int n,int pos,int val)
{
	while(pos<=n)
	{
		treearr[pos]+=val;
		pos+=lowbit(pos);
	}
}

int query(int pos)
{
	int t=0;
	while(pos>0)
	{
		t+=treearr[pos];
		pos-=lowbit(pos);
	}
	return t;
}

int main()
{
	int n=0,m=0,op=0,x=0,val=0,l=0,r=0;
	cin>>n>>m;
	for(int i=1;i<=n;i++)
	{
		cin>>arr[i];
	}
	for(int i=1;i<=m;i++)
	{
		cin>>op;
		if(op==1)
		{
			cin>>l>>r>>val;
			change(n,l,val);
			change(n,r+1,-val);
		}
		else
		{
			cin>>x;
			cout<<query(x)+arr[x];
			if(i<m)cout<<endl;
		}
		
	}
	return 0;
}

树状数组比线段树的优点就是码量巨小，好调试，没别的。

3.平衡树选讲

平衡树是一种较为强劲~~但真的很麻烦~~的二叉搜索树。

一般平衡树的时间都比权值线段树长，但是空间只需一倍，而不是8倍，但有动态开点后还管什么！平衡树主要还能解决区间翻转，比如所谓“文艺平衡树”，这个权值线段树比较困难，不好实现对应的操作。

多种平衡树的主要作用都是防止二叉查找树退化成链。一般的，当插入的节点过多过密时，线段树基本上就只有一条链有实际信息了。比如想象一下插入\({1,4,5}\)三种元素的其中一个，插\(1e7\)次，那查询时肯定有许多冗余区间，而且会把树高退化到\(O(n)\)，更不利于查找。平衡树就是通过给每个点一个随机权值，使树高维持在\(O(\log_2 n)\)，防止成链。

平衡树基于这两个指标维护树高和查找的操作也是多种多样~~而且很抽象~~的，一般来说，平衡树和它们维护树高的操作如下：

\(有旋treap\)：左旋，右旋
\(伸展树/Splay\)：旋转
\(无旋treap/fhq-treap\)：分裂，合并

是不是只有最后一个最特殊？那就是我们要学的（

\(fhq-treap\)是范浩强大佬在\(treap\)的基础上，~~基本上掀了~~加以改进得到的。所谓\(treap\)，就是\(tree+heap\)，前者是树，后者是堆。

具体来说，对于每个点，我们赋两个值：\(val\)和\(randval\)，前者就是你要添加/删除的数，后者用\(rand()\)决定。对于\(val\)，我们采用二叉搜索树来存储，即左子树每个节点的值都小于根节点，右子树每个结点的值都大于根节点，但我们再根据\(randval\)，把这棵树稍作修改，使其符合小根堆的性质。堆结构就是用来维持树高稳定的。所以叫平衡树。

好，我们先来了解平衡树结点的结构，它一般如下所示：

Copy
struct node
{
  int l;
  int r;
  int size;
  int val;
  int randval;
}
node tree[maxn];

在权值线段树里你也感受到了，每个结点的所有儿子并无一个稳定的规律，所以这里的\(l\)，\(r\)都是指向当前节点的左右儿子，其余的前面已经提到过了。

新建一个节点就只要填表了。我们设一个\(idx\)表示当前总点数。

Copy
void newnode(int &x,int val)
{
  x=++idx;//直接更改新点数，不返回了
  tree[idx].val=val;
  tree[idx].size=1;
  tree[idx].randval=rand();
}

回到操作，普通\(treap\)维持堆结构的操作就是左旋和右旋，当\(randval\)不对劲时，根据\(randval\)的大小，把根节点和左右儿子对调。就像是旋转了一样。

这么转来转去确实太容易把人转糊涂了，所以有旋treap在赛场上的使用率最低（

而\(范夶(\mathrm{b\check{i}})奆(\mathrm{ju\grave{a}n})\)不是怎么想的，他提出了两个新操作：分裂与合并

怎么做呢？

分裂有两种，要么按节点值域将一棵树分成两棵，并删掉一些边，使其仍符合平衡树的结构；要么按子树大小分。前者一般用在普通平衡树，后者一般用在文艺平衡树。受限于例题要求，本文只讲按节点值域分裂。

按值域分裂，我们先确定参数，和线段树差不多：

Copy
void split(int pos,int val,int &x,int &y);

它们分别表示当前位置、按什么值分裂，新的两棵树的树根，可以看成是对节点的左右儿子的关系的更改。根节点和左右儿子的关系就是树的边嘛，这样就让我们联想到加边和删边，也就是分裂和合并中必备的操作。

好，首先，如果当前位置\(pos\)为空，那我们可能走错节点了，应该把传进来的\(x\)和\(y\)都改成\(0\)，表示我们发现这两个边应该要删掉。然后就撤。

\(pos\)不为空呢？还记得\(treap\)的\(tree\)性质吗？由于按值分裂，我们就考虑传入的\(val\)和当前节点的\(val\)的关系。

如果当前节点的\(val\le\)传入的\(val\)，那根据\(tree\)性质，比当前节点\(val\)大的肯定是右儿子，我们就以右儿子作为\(pos\)，并且别忘了我们还要分裂，当前节点和右儿子必须分开，也就是它们连的边要删掉。

分裂完以后，可能会出现新的树，所以我们要及时把\(x\)，\(y\)的引用改成对应的\(pos\)，表示节点儿子的更新。（指指点点）（C++的引用太折磨人啦）

既然删了边，那也要考虑连上边，但是好消息是这里不需要了，我们传的\(x\)和\(y\)都是引用，既然传的是当前节点的左右儿子指针，那么指针也会被自动修改成分裂后正确的儿子。

如果是\(<\)，那么我们显然要找左子树，而且也要删掉当前节点和左子树的边。

最后，我们再更新下节点的\(size\)值，使其符合修改后的实际。也是从前几天的线段树copy一下\(pushup()\)就行了（但是要把根节点自己算进去，所以最后还要加1）。

最后，你应该写出如下函数：

不管是分裂&&合并、还是左旋&&右旋、还是旋转，都建议手模到懂了代码到底在干什么为止

Copy
void split(int pos,int val,int &x,int &y)
{
  if(!pos)
  {
    x=y=0;
    return;
  }
  if(tree[pos].val<=val)
  {
    x=pos;
    split(tree[x].r,val,tree[x].r,y);
    pushup(x);
  }
  else
  {
    y=pos;
    split(tree[y].l,val,x,tree[y].l);
    pushup(y);
  }
}

这里给一组样例，忽略了\(size\)的变化，你可以手模一下：

Copy
6 5
//边的方向：u→v
7 5 8 3 6 13//每个点的大小
1 2
1 3
2 4
2 5
3 6

然后我们再来看看合并。先给出合并的函数原型：

Copy
int merge(int x,int y);

这里的两个参数就是要合并的两棵树的根节点，然后返回值就是新树的根节点。还是很简单的。接下来就开始实现

首先判一下，如果有任意一棵子树为空，那我们就直接返回另一个，你问怎么写？x=0能不能推出x+y=y？对的，我们直接返回x+y。

如果两棵子树都不为空，那肯定就要准备合并了，我们在这里规定一个前提，两棵子树都必须是\(val\)有序的，且有一棵子树的\(val\)必须全部小于另一棵树的\(val\)。这样，我们就只关心哪棵树的根作为新树的根，两棵树内部就不用调整边了。这可是不能乱搞的，合并是分裂的逆操作，我们做完一次分裂以后，再做一次合并要能复原。所以分裂断掉的边，合并还要补上。

我们这时就要想起\(treap\)的\(heap\)性质，如果我们随意确定根节点的话，很可能会让树链化。所以这时，我们使用\(randval\)来判断。\(randval\)小的放在上面，以维护小根堆的形态。

同样的，合并也是递归的过程，由于只要把\(randval\)小的放上面，我们的递归就很简单了。

你可以写出如下代码：

Copy
int merge(int x,int y)
{
  if(!x||!y)return x+y;
  else
  {
    if(tree[x].key<tree[y].key)
    {
      tree[x].r=y;
      pushup(x);
      return x;
    }
    else
    {
      tree[y].l=x;
      pushup(y);
      return y;
    }
  }
}

砹氩，我们花了这么长的篇幅讲这两种基本操作，接下来该讲讲怎么用它们两个实现那几个具体功能了吧？

首先是添加/删除数。我们平衡树把相同的数作为不同的节点，因为开出来的\(randval\)很可能不相同。所以增删数就相当于加减节点。那我们来思考，怎么样分裂合并会让节点数发生改变呢？

首先是增加数，我们首先将原树按要加的这个数分裂，这样，分裂完的左子树应该全部小于等于要加的数，右子树就应该全部大于，为了维护堆的性质，如果把新节点和右子树先合并，那左右子树值域就可能有交叉，那不行。所以，我们先将新节点作为一棵树和左子树合并，然后新左子树再和右子树合并。

简单说就是“分裂一次，合并两次”

删掉一个数，就先按要删的数将原数分开，左子树肯定是小于等于这个数的，所以我们再对左子树进行（传入数-1）的分裂，第二次右子树的根节点就存在第三个变量里备用。这样第三个变量为根的子树，就是我们要删的数的全部节点了！（为什么是传入数-1？应该不会有~~毒瘤题目~~绝世好题在数据结构出浮点数吧？那把多和少的剥掉了，不就剩等于的了？）

然后有一个很搞笑的操作（真的很搞笑）：把第三个变量这棵子树的左右儿子合并，也就是说，原来的根节点就变成了光杆司令，左右儿子抱团了嘛。那么我们就相当于删了根节点，所以我们就成功删了一个点。也就删了这个数。

最后再进行一次合并，也是一样的，优先合并小的和等于的，再合并大的。完工！

同样的，这个是“分裂两次，合并三次”

那我们再思考一下怎么进行另一对互逆操作，根据排名查数和根据数查排名。

根据数查排名倒是相当好想，我们根据（传入数-1）将树分裂，那么左子树肯定都小于等于（传入数-1），也就严格小于传入数，我们就统计出了小于传入数的数的个数，怎么统计？就是左子树的大小嘛！再+1就是排名了。完事别忘了把树装回去。

根据排名查数则略嫌麻烦，有逆操作的经验，我们也考虑用左子树的大小做文章，如果传入排名刚好等于当前节点的左子树大小+1，那我们就直接返回这个节点是哪个数就可以了，不然的话，我们就做递归。

如果传入排名小于等于左子树的大小（严格小于左子树大小+1），我们就查左子树的传入排名。如果比左子树大小+1还大，那我们就只能往右区间找了，记得减掉左子树占的名额（大小+1）。

习题3.1.1#

P3369 【模板】普通平衡树

有没有发现我上面讲的内容就是这道题？快动手吧！

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e7;
#define int long long

struct node
{
	int l;
	int r;
	int val;
	int sval;
	int size;
};
node tree[maxn];
int root=0;
int idx=0;

void newnode(int &x,int v)
{
	x=++idx;
	tree[idx].val=v;
	tree[idx].sval=rand();
	tree[idx].size=1;
}

void pushup(int pos)
{
	tree[pos].size=tree[tree[pos].l].size+tree[tree[pos].r].size+1;
}

void split(int pos,int val,int &x,int &y)//按值分裂,取决于树的路径长，O(log n)
{
	if(!pos)
	{
		x=y=0;
		return;
	}
	if(tree[pos].val<=val)
	{
		x=pos;
		split(tree[x].r,val,tree[x].r,y);
		pushup(x);
	}
	else
	{
		y=pos;
		split(tree[y].l,val,x,tree[y].l);
		pushup(y);
	}
}

int merge(int x,int y)//只需要考虑两棵树根节点的大小，因为它们内部都是有序的。返回值为新树的根节点，O(log n)
{
	if(!x||!y)return x+y;
	if(tree[x].sval<tree[y].sval)
	{
		tree[x].r=merge(tree[x].r,y);
		pushup(x);
		return x;
	}
	else
	{
		tree[y].l=merge(x,tree[y].l);
		pushup(y);
		return y;
	}
}

void ins(int v)
{
	int x,y,z;
	split(root,v,x,y);
	newnode(z,v);
	root=merge(merge(x,z),y);
}

void del(int v)
{	
	int x,y,z;	
	split(root,v,x,z);
	split(x,v-1,x,y);
	y=merge(tree[y].l,tree[y].r);
	root=merge(merge(x,y),z);
}

int kth(int pos,int k)
{
	if(k==tree[tree[pos].l].size+1)
	{
		return tree[pos].val;
	}
	else if(k<=tree[tree[pos].l].size)
	{
		return kth(tree[pos].l,k);
	}
	else
	{
		return kth(tree[pos].r,k-tree[tree[pos].l].size-1);
	}
}

int pre(int val)
{
	int x,y;
	split(root,val-1,x,y);
	int ans=kth(x,tree[x].size);
	root=merge(x,y);
	return ans;
}

int suc(int val)
{
	int x,y;
	split(root,val,x,y);
	int ans=kth(y,1);
	root=merge(x,y);
	return ans;
}

int getrank(int val)
{
	int x,y;
	split(root,val-1,x,y);
	int ans=tree[x].size+1;
	root=merge(x,y);
	return ans;
}

signed main()
{
	int n=0,op=0,s=0;
	cin>>n;
	for(int i=1;i<=n;i++)
	{
		cin>>op>>s;
		if(op==1)
		{
			ins(s);
		}
		if(op==2)
		{
			del(s);
		}
		if(op==3)
		{
			cout<<getrank(s);
			if(i<n)cout<<endl;
		}
		if(op==4)
		{
			cout<<kth(root,s);
			if(i<n)cout<<endl;
		}
		if(op==5)
		{
			cout<<pre(s);
			if(i<n)cout<<endl;
		}
		if(op==6)
		{
			cout<<suc(s);
			if(i<n)cout<<endl;
		}
	}
	return 0;
}

按道理讲，平衡树有入坟入门五题，但是我太菜了，先只做这一道吧。

4.树形结构的应用

有些数据结构，名字根本不带“树”，但事实上也是利用了树形结构的思想，我们对目标要求范围内的这种数据结构进行简单的讲解。

4.1 并查集#

这个东西，我自己看了一年也没看明白，但是这是雅苯教练给我讲的第一个知识点，在此鸣谢！

设想有\(n\)个元素（理论上是任意的数据结构），我们只有两种操作：

把任两个元素扔进一个大的“集合”里
查询两个元素是否在一个“集合”内

一个暴力的想法是直接开个\(set\)数组。每个元素的初始值为自己的下标。对于“扔进一个大‘集合’”这个操作，我们可以把两个元素对应下标的值改成一个一样的数，“查询”就直接查询两个元素的\(set\)值是否相等就可以了。这两个实现的复杂度都肯定是\(O(1)\)的……

一定是\(O(1)\)吗？设想下面一组数据：

Copy
5 4   ;五个元素，四个操作
1 1 3 ;合并1 3，下列"1"指令同理
1 2 5
1 3 5
2 1 2 ;查询1 2是否在一个集合内。

首先看看上文加粗的字，“一样的数”怎么定义？这是个好问题。我们姑且先定义“一样的数”为指令的第一个操作数。

好，看看合并指令执行完后，\(set\)是个什么情况：

Copy
1 2 1 4 2

执行最后一条指令，当然“FALSE啦”！

真FALSE？你手模一遍：

最后的情况本来是：

Copy
set 1: 1 2 3 5
set 2: 4

明明就是TRUE嘛！

那怎么办？肯定是“一样的数”定义错了！可惜，你除了改成“第二个操作数”，还能改成什么？事实上，你在线性序列里，根本无法保证查询操作的正确，就算能做到，也不是\(O(1)\)的，搞不好并没有多项式解法（

那我们怎么做呢？作为\(AK\space IOI\)的种子选手，这种操作都实现不了？\(doge\)

一种想法是把集合不再局限在“线性序列”的刻板印象里，而是一棵树，那就好判断了，如果两个点所在的“集合树”的根节点相同，那肯定就在一个集合里，反之亦然。

怎么找根节点？不要讲了吧？既然每个节点的父亲一开始都定义成自己的编号了，如果编号依然等于自己，那就说明这个点掌握了自己的人生（雾），肯定是根节点啊！

一个口胡证明：两棵有根树不可能有公共点，比如考虑以下以邻接表给出的树，无向边会成链，所以是有向边：
Copy
5 4
1 2
1 3
4 3
4 5
显然若把1和4当作两个根节点，那这两棵树就可以有一个公共点3，那这样，谁来做代表集合的树根呢（

这样我们就有了集合确定的唯一性，而且因为借助树的结构，我们要判根很容易，极限情况下是\(O(\log_2 n)\)（树的最大高度），但是还有更优解，接下来介绍两个并查集的常见优化：

路径压缩

每往上跳一层，我们就把当前节点的父亲改成当前节点的父节点的父亲，如此循环，最后原本在一条链上的节点都和根节点直接相连，下次查找路径就短了。

按秩合并/启发式合并

因为你显然不能保证两棵待合并的“集合树”都已经路径压缩至最优，所以它们的高度肯定是\(\ge 2\)的。那为了压查找的时间，我们就可以按树的高度进行抉择，把高度小的树根节点的父节点设为高度大的树的根节点。这种方法就叫按秩合并，要这么做，需要开个\(rank\)数组维护每个点所在高度，而且集合合并会变得较为复杂（

因此，我们在赛场上常使用另一种可能不那么稳定，但是好写的多的优化：启发式合并。

讲的很高深，事实上，直观也可以感受到，树的高度越高，节点就应该越多，所以我们可以按两棵树的大小决策，把节点少的树加进节点多的树。这么做一下，可以让单次合并复杂度直接降到\(O(\alpha(n))\)。这个数学证明是真的很复杂，~~所以就不放了QAQ~~

\(\alpha(n)\)是阿克曼函数的反函数，在OI的数据规模内，可以认为是一个不大于\(4\)的常数

为什么说不稳定呢？因为如果其中有一棵树路径压缩很彻底，而另一棵就压缩的很少，显然这时可能会将压缩少的树放去压缩多的树，从而跑更长的路。~~但是问题不大的~~。

有时因为集合的边维护了某种信息，这时不能简单的路径压缩，我们就只使用按秩合并或启发式合并。

但是呢，一旦合并到一个集合里，就很难在多项式时间里把两个点分开。只是提一嘴，没考过（

关于这个“树”怎么存呢？事实上，只要开个对应的\(fa\)数组，维护每个点对应的父亲就可以了。初始化也和暴力一样，初始化为每个元素的对应下标。再开个\(sz\)数组维护大小，每个元素的\(sz\)初始为1，结束！

习题4.1.1#

P3367 【模板】并查集

这就是模板题了。动手吧！

为什么这么多人不喜欢写\(merge()\) (

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e4+5;

int fa[maxn];
int size[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

void merge(int x,int y)
{
  x=find(x);
  y=find(y);
  if(size[x]>size[y])swap(x,y);
  fa[x]=y;
  size[x]+=size[y];
}

int main()
{
  int n=0,m=0,z=0,x=0,y=0;
  cin>>n>>m;
  set_make(n);
  for(int i=1;i<=m;i++)
  {
    cin>>z;
    if(z==1)
    {
      cin>>x>>y;
      //cout<<"Union set "<<x<<" with set "<<y<<endl;
      merge(x,y);
    }
    if(z==2)
    {
      cin>>x>>y;
      //cout<<x<<" is in set "<<find(x)<<endl;
      //cout<<y<<" is in set "<<find(y)<<endl;
      cout<<(find(x)==find(y)?"Y":"N");
      if(i<m)cout<<endl;
    }
  }
  return 0;
}

好像判集合写丑了，汗。

习题4.1.2#

P1551 亲戚

看了半天回想，这实在找不出不是双倍经验的理由（

完了，这个判同祖先怎么也写得这么丑（

哦，题目原因，没事）

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e4+5;

int fa[maxn];
int size[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

void merge(int x,int y)
{
  x=find(x);
  y=find(y);
  if(size[x]>size[y])swap(x,y);
  fa[x]=y;
  size[x]+=size[y];
}

int main()
{
  int n=0,m=0,p=0,mx=0,my=0,px=0,py=0;
  cin>>n>>m>>p;
  set_make(n);
  for(int i=1;i<=m;i++)
  {
    cin>>mx>>my;
    merge(mx,my);
  }
  for(int i=1;i<=p;i++)
  {
    cin>>px>>py;
    cout<<((find(px)==find(py))?"Yes":"No");
    if(i<p)cout<<endl;
  }
  return 0;
}

习题4.1.3#

P1525 [NOIP2010 提高组] 关押罪犯

说了要把这道题作为并查集的典题的，差点忘了。

这一题代表一种常考题型，叫做“种类并查集”或者“种族并查集”，主要就是解决这种“敌人”问题

我们假想，对于每个元素\(i\)都有一个“共轭”兄弟\(i'\)，它们名义上是一个点，但属性截然相反。比如\(i\)和\(j\)是敌人，那\(i\)和\(j'\)，\(i'\)和\(j\)就是好朋友。

我们考虑将关系建模成节点的边，那我们就可以采用简单的贪心策略，将这些边按边权从大到小排序，从最小的开始选，每次选条边，就尝试将边的两个端点各自和对方的“共轭”兄弟合并，如果已经被合并过了，那就说明不能这么安排，此时这条边的边权就是答案。

砹氩这个\(merge()\)写的更丑了，有时间要把这些讲解题目的远古代码都重构一遍！！

事实上：咕值++

怎么在程序中表示\(i'\)和\(j'\)呢？我们可以直接开两倍的\(fa\)和\(sz\)，然后，对于每个节点\(k\)，直接令\(k+n\)为\(k'\)，好写好记。

而且，既然使用了“边”的概念，那么这道题就可以用些图论的算法过，比如标签里的“tarjan”和“二分图”，这些与本讲无关，所以略去，作为思考。

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;

int n=0,m=0;
int fa[maxn];
int size[maxn];

struct relation
{
  int a,b,c;
  
  friend bool operator <(const relation &a,const relation &b)
  {
    if(a.c<b.c)return true;
    else return false;
  }

};


relation arr[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

bool merge(int x,int y)
{
  int x1=find(x);
  int y1=find(y);
  int x2=find(x+n);
  int y2=find(y+n);
  if(x1==y1)return false;
  fa[x1]=y2;
  fa[y1]=x2;
  return true;
}

int main()
{
  cin>>n>>m;
  set_make(2*n);
  for(int i=1;i<=m;i++)
  {
    cin>>arr[i].a>>arr[i].b>>arr[i].c;
  }
  sort(arr,arr+m+1);
  /*for(int i=1;i<=m;i++)
  {
    cout<<arr[i].c<<' ';
  }
  cout<<endl;*/
  for(int i=m;i>=1;i--)
  {
    //cout<<arr[i].a<<' '<<arr[i].b<<endl;
    if(merge(arr[i].a,arr[i].b)==false)
    {
      cout<<arr[i].c;
      return 0;
    }
  }
  cout<<0;
  return 0;
}

习题4.1.4#

P1892 [BOI2003]团伙

这题也是种类并查集的碘

对于这题，如果\(i\)和\(j\)是敌人，我们就把\(i\)和\(j'\)，\(j\)和\(i'\)两对好朋友节点合并，如果\(i\)和\(j\)本来就是朋友，那就直接合并。

最后统计有多少个集团，也就是集合的个数，输出就可以了。

总算有个优美的\(merge()\)了

AC Code：

Copy
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e3+5;
const int maxm=5e3+7;

int fa[maxn*2];
int sz[maxn*2];

void set_make(int n)
{
	for(int i=1;i<=n;i++)
	{
		fa[i]=i;
		sz[i]=1;
	}
}

int find(int x)
{
	if(fa[x]==x)return fa[x];
	else return fa[x]=find(fa[x]);
}

bool merge(int x,int y)
{
	x=find(x);
	y=find(y);
	if(x==y)return false;
	else
	{
		fa[x]=y;
		return true;
	}
}

int main()
{
	int n=0,m=0,u=0,v=0;
	int res=0;
	char order;
	cin>>n>>m;
	set_make(n*2);
	for(int i=1;i<=m;i++)
	{
		cin>>order;
		cin>>u>>v;
		if(order=='E')
		{
			merge(u+n,v);
			merge(v+n,u);
		}
		if(order=='F')
		{
			merge(u,v);
		}
	}
	for(int i=1;i<=n;i++)
	{
		if(fa[i]==i)res++;
	}
	cout<<res;
	return 0;
}

2024/8/24 23:32:00 初稿！完结撒花！！！（发布于洛谷）

posted @ 2024-08-26 01:04 Treap_Kongzs 阅读(24) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 搜索选讲、分块初步、莫队简介

· 三角函数：基础知识&&Omega范围问题

· [数据结构] 树状数组及线段树详解

· 数据结构相关

· 学习笔记-平衡树

阅读排行：
· 地球OL攻略 —— 某应届生求职总结
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】

树形问题选讲

soapprice

I'm here... Welcome

树形问题选讲

省流：本篇专供冲击NOIP一等的人使用，坐标HN

1.ST表&&倍增法求LCA

1.1 ST表#

习题1.1.1#

1.2 倍增法求LCA#

习题1.2.1#

2. 线段树

2.1 普通线段树#

习题2.1.1#

习题2.1.2#

习题2.1.3#

2.2 权值线段树#

习题2.2.1#

2.3 树状数组#

习题2.3.1#

习题2.3.2#

3.平衡树选讲

习题3.1.1#

4.树形结构的应用

4.1 并查集#

习题4.1.1#

习题4.1.2#

习题4.1.3#

习题4.1.4#

公告