线段树模板
一、简介线段树
ps: _此处以询问区间和为例。实际上线段树可以处理很多符合结合律的操作。
(比如说加法,a[1]+a[2]+a[3]+a[4]=(a[1]+a[2])+(a[3]+a[4]))
线段树之所以称为“树”,是因为其具有树的结构特性。
线段树由于本身是专门用来处理区间问题的(包括RMQ、RSQ问题等)。
(图片来源于互联网。
对于每一个子节点而言,都表示整个序列中的一段子区间;
对于每个叶子节点而言,都表示序列中的单个元素信息;
子节点不断向自己的父亲节点传递信息,而父节点存储的信息则是他的每一个子节点信息的整合。
有没有觉得很熟悉?
对,线段树就是分块思想的树化,或者说是对于信息处理的二进制化
用于达到O(logn)级别的处理速度,log以2为底。
(其实以几为底都只不过是个常数,可忽略)。
而分块的思想,则是可以用一句话总结为:
通过将整个序列分为有穷个小块,
对于要查询的一段区间,总是可以整合成k个所分块与m个单个元素的信息的并集(0<=k,m<=sqrt(n))
Extra Tips:
其实,虽然线段树的时间效率要高于分块
但是实际上分块的总合并次数不会超过sqrt(n)
但是毕竟也只是一个很大的常数而已
虽说如此,分块的应用范围还是要广于线段树的,
因为虽然线段树好像很快,但是它只能维护带有结合律的信息,
比如区间max/min、sum、xor之类的,
但是不带有结合律的信息就不能维护(且看下文分解);
而分块则灵活得多,可以维护很多别的东西,
因为实际上分块的本质就是优雅的暴力。
其实越暴力的算法可以支持的操作就越多、功能性就越强.
n^2n2的暴力几乎什么都可以维护(huaji
二、逐步分析线段树的构造实现
1、建树与维护
由于二叉树的自身特性,对于每个父亲节点的编号ii,他的两个儿子的编号分别是2i2i和2i+12i+1,所以我们考虑写两个O(1)O(1)的取儿子函数:
int n; int ans[MAXN*4]; inline int ls(int p){return p<<1;}//左儿子 inline int rs(int p){return p<<1|1;}//右儿子
Extra Tips:
1、此处的inlineinline可以有效防止无需入栈的信息入栈,节省时间和空间。
2、二进制位左移一位代表着数值*2,而如果左移完之后再或上1,由于左移完之后最后一位二进制位上一定会是0,所以|1等价于+1。
用二进制运算不是为了装X,相信我,会快的!
那么根据线段树的服务对象,可以得到线段树的维护:
void push_up_sum(int p){ t[p]=t[lc(p)]+t[rc(p)]; }// 向上不断维护区间操作 void push_up_min(int p){//max and min t[p]=min(t[lc(p)],t[rc(p)]); //t[p]=max(t[lc(p)],t[rc(p)]); }
此处一定要注意,push_up操作的目的是为了维护父子节点之间的逻辑关系。
当我们递归建树时,对于每一个节点我们都需要遍历一遍,
并且电脑中的递归实际意义是先向底层递归,然后从底层向上回溯,
所以开始递归之后必然是先去整合子节点的信息,
再向它们的祖先回溯整合之后的信息。
(其实是正确性证明)
实际上push_up是在合并两个子节点的信息,所以需要信息满足结合律!
那么对于建树,由于二叉树自身的父子节点之间的可传递关系,所以可以考虑递归建树,
并且在建树的同时,我们应该维护父子节点的关系:
void build(ll p,ll l,ll r) { if(l==r){ans[p]=a[l];return ;} //如果左右区间相同,那么必然是叶子节点啦,只有叶子节点是被真实赋值的 ll mid=(l+r)>>1; build(ls(p),l,mid); build(rs(p),mid+1,r); //此处由于我们采用的是二叉树,所以对于整个结构来说,可以用二分来降低复杂度,否则树形结构则没有什么明显的优化 push_up(p); //此处由于我们是要通过子节点来维护父亲节点,所以pushup的位置应当是在回溯时。 }
2、接下来谈区间修改
为什么不讨论单点修改呢?
因为其实很显然,单点修改就是区间修改的一个子问题而已,
即区间长度为1时进行的区间修改操作罢了
那么对于区间操作,我们考虑引入一个名叫“lazy tag”(懒标记)的东西
之所以称其“lazy”,是因为原本区间修改需要通过先改变叶子节点的值,
然后不断地向上递归修改祖先节点直至到达根节点,
时间复杂度最高可以到达O(nlogn)的级别。
但当我们引入了懒标记之后,
区间更新的期望复杂度就降到了O(logn)的级别
甚至会更低.
(1)首先先来从分块思想上解释如何区间修改:
分块的思想是通过将整个序列分为有穷个小块,对于要查询的一段区间,总是可以整合成k个所分块与m个单个元素的信息的并(0<=k,m<=log(n))
那么我们可以反过来思考这个问题:
对于一个要修改的、长度为L的区间来说,
总是可以看做由一个长度为2^log(⌊n⌋)和剩下的元素(或者小区间组成)。
那么我们就可以先将其拆分成线段树上节点所示的区间,之后分开处理:
如果单个元素被包含就只改变自己,如果整个区间被包含就修改整个区间
其实好像这个在分块里不是特别简单地实现,
但是在线段树里,无论是元素还是区间都是线段树上的一个节点,
所以我们不需要区分区间还是元素,加个判断就好。
(2)懒标记的正确打开方式
首先,懒标记的作用是记录每次、每个节点要更新的值,也就是delta,
但线段树的优点不在于全记录(全记录依然很慢),而在于传递式记录:
整个区间都被操作,记录在公共祖先节点上;
只修改了一部分,那么就记录在这部分的公共祖先上;
如果四环以内只修改了自己的话,那就只改变自己。
之后,如果我们采用上述的优化方式的话,
我们就需要在每次区间的查询修改时push_down一次,
以免重复或者冲突或者爆炸
那么对于push_down而言,
其实就是纯粹的push_up的逆向思维(但不是逆向操作):
因为修改信息存在父节点上,所以要由父节点向下传导llazy tag
那么问题来了:怎么传导push_down呢?
这里很有意思,
开始回溯时执行push_up,因为是向上传导信息;
那我们如果要让它向下更新,就调整顺序,
在向下递归的时候push_down;
如此简单....(逃
inline void f(ll p,ll l,ll r,ll k) { tag[p]=tag[p]+k; ans[p]=ans[p]+k*(r-l+1); //由于是这个区间统一改变,所以ans数组要加元素个数次啦 } //我们可以认识到,f函数的唯一目的,就是记录当前节点所代表的区间 inline void push_down(ll p,ll l,ll r) { ll mid=(l+r)>>1; f(ls(p),l,mid,tag[p]); f(rs(p),mid+1,r,tag[p]); tag[p]=0; //每次更新两个儿子节点。以此不断向下传递 } inline void update(ll nl,ll nr,ll l,ll r,ll p,ll k) { //nl,nr为要修改的区间 //l,r,p为当前节点所存储的区间以及节点的编号 if(nl<=l&&r<=nr) { ans[p]+=k*(r-l+1); tag[p]+=k; return ; } push_down(p,l,r); //回溯之前(也可以说是下一次递归之前,因为没有递归就没有回溯) //由于是在回溯之前不断向下传递,所以自然每个节点都可以更新到 ll mid=(l+r)>>1; if(nl<=mid)update(nl,nr,l,mid,ls(p),k); if(nr>mid) update(nl,nr,mid+1,r,rs(p),k); push_up(p); //回溯之后 }
对于复杂度而言,由于完全二叉树的深度不超过logn,
那么单点修改显然是O(logn)的,
区间修改的话,由于我们的这个区间至多分log(n)个子区间,
对于每个子区间的查询是O(1)的,所以复杂度自然是O(logn)
不过带一点常数
3、那么对于区间查询
没什么好说的,由于是信息的整合,所以还是要用到分块思想,我实在是不想再码一遍了qwqqwq
ll query(ll q_x,ll q_y,ll l,ll r,ll p) { ll res=0; if(q_x<=l&&r<=q_y)return ans[p]; ll mid=(l+r)>>1; push_down(p,l,r); if(q_x<=mid)res+=query(q_x,q_y,l,mid,ls(p)); if(q_y>mid) res+=query(q_x,q_y,mid+1,r,rs(p)); return res; }
四、STD
#include<iostream> #include<cstdio> #define MAXN 1000001 #define ll long long using namespace std; unsigned ll n,m,a[MAXN],ans[MAXN<<2],tag[MAXN<<2]; inline ll ls(ll x) { return x<<1; } inline ll rs(ll x) { return x<<1|1; } void scan() { cin>>n>>m; for(ll i=1;i<=n;i++) scanf("%lld",&a[i]); } inline void push_up(ll p) { ans[p]=ans[ls(p)]+ans[rs(p)]; } void build(ll p,ll l,ll r) { tag[p]=0; if(l==r){ans[p]=a[l];return ;} ll mid=(l+r)>>1; build(ls(p),l,mid); build(rs(p),mid+1,r); push_up(p); } inline void f(ll p,ll l,ll r,ll k) { tag[p]=tag[p]+k; ans[p]=ans[p]+k*(r-l+1); } inline void push_down(ll p,ll l,ll r) { ll mid=(l+r)>>1; f(ls(p),l,mid,tag[p]); f(rs(p),mid+1,r,tag[p]); tag[p]=0; } inline void update(ll nl,ll nr,ll l,ll r,ll p,ll k) { if(nl<=l&&r<=nr) { ans[p]+=k*(r-l+1); tag[p]+=k; return ; } push_down(p,l,r); ll mid=(l+r)>>1; if(nl<=mid)update(nl,nr,l,mid,ls(p),k); if(nr>mid) update(nl,nr,mid+1,r,rs(p),k); push_up(p); } ll query(ll q_x,ll q_y,ll l,ll r,ll p) { ll res=0; if(q_x<=l&&r<=q_y)return ans[p]; ll mid=(l+r)>>1; push_down(p,l,r); if(q_x<=mid)res+=query(q_x,q_y,l,mid,ls(p)); if(q_y>mid) res+=query(q_x,q_y,mid+1,r,rs(p)); return res; } int main() { ll a1,b,c,d,e,f; scan(); build(1,1,n); while(m--) { scanf("%lld",&a1); switch(a1) { case 1:{ scanf("%lld%lld%lld",&b,&c,&d); update(b,c,1,n,1,d); break; } case 2:{ scanf("%lld%lld",&e,&f); printf("%lld\n",query(e,f,1,n,1)); break; } } } return 0; }
本文转自@
pks'w blog