线段树(一) _概述 基本操作

线段树 Segment_tree

网上有人把线段树翻译成 Interval_Tree

Interval_Tree 是另外一种数据结构 而且并非二叉树

这个是线段树的标准E文翻译

可以看wikipedia的原文 http://en.wikipedia.org/wiki/Segment_tree

顾名思义 线段树存储的是连续的线段而非离散的节点

先看一张经典的线段树图解

这个就是标准的线段树

既然是树形结构 我们就得先考虑怎么存储这棵树

分析线段树的定义

*线段树是一棵二叉树 记为T(a, b)

*参数a,b表示区间[a,b] 其中b-a称为区间的长度 记为L

*线段树T(a,b)也可递归定义为

  -若L>1  [a, (a+b) div 2]为T的左儿子

         [(a+b) div 2,b]为T的右儿子

  -若L=1    T为叶子节点

可以得到一些基本性质

*线段树除最后一层外是满二叉树

*线段树是平衡的 高度是Log2L左右

如此我们有2种存储方法

*直接用指针

定义节点

struct node{
	int L,r;
	int color;
}post[N<<2];

其中ls rs分别为左右儿子 l,r是区间的范围

真正实现时一般用数组模拟指针

我们只需定义longint数组ls[]rs[] l[] r[]

*用*2和*2+1代替左右儿子指针

由于是除最后一层外是满二叉树

我们可以向存储堆一样存储线段树

用l[]r[]来存储节点区间范围

x的左右儿子分别就是x*2和x*2+1

具体实现用位移代替乘2

这样乘法指针运算和上述数组调用一样 几乎不需要时间

具体用哪种纯粹是个人喜好 没什么区别

(下文中我的程序都是用的数组模拟 直接存储儿子指针)

接下来讨论线段树的具体操作

也就是维护这种数据结构的算法 (srO 数据结构+算法=程序 Orz)

总结起来就两个词 递归 & 分治

结合一个具体问题吧 PKU 2777

http://poj.org/problem?id=2777

这是线段树的入门题 相当经典

要求程序实现一个涂色的程序

支持对区间[A,B]涂C的颜色统计区间[A,B]的颜色种类

朴素的做法是用数组a[]存储下整个区间[0,100000]

然后循环涂色 循环查询 这样的复杂度是N*N 大大地TLE

我们考虑用线段树处理这个区间问题

首先我们得建树

先看程序

void Build(int L,int r,int id){
	post[id].L=L;
	post[id].r=r;
	post[id].color=1;
	if(L!=r){
		int mid=(L+r)>>1;
		Build(L,mid,id<<1);
		Build(mid+1,r,id<<1|1);
	}
}

*build函数是一个递归的过程 参数L,r表示当前建立区间[L,r]的节点

* L!=r 是递归的边界条件 即建立到叶子节点了

*根据线段树定义 分别递归建立左右儿子区间

-2*id,2*id+1分别为当前节点的左子树和右子树

  -注意使用运算提高效率 还需注意L r mid 皆为区间端点
 

其实上文中建好的线段树其实是一个骨架

就相当于朴素做法中我们还未操作的空数组 等待我们给它刷颜色

既然要刷颜色 我们就得存储各区间的颜色 给每个节点新开一个域n来记录颜色

表现在数组模拟上就是新建数组n[]

n数组代表当前节点所代表区间的颜色

因为这个问题的染色是覆盖类型的染色

对一个区间染色自然把为当前区间的子区间也染色

所以是对子树染色而非区间染色

接着这样的思路 我们可以写出如下程序

int mid=(post[id].r+post[id].L)>>1;
	if(post[id].L==L&&post[id].r==r){
		post[id].color=color;
		return;
	}
	if(post[id].color==color)
		return;
	if(post[id].color>0){
		post[id<<1].color=post[id<<1|1].color=post[id].color;
		post[id].color=0;
	}

*判断当前区间是否在需要覆盖的区间内 是就修改颜色

 

这里需要说明一下这种写法的正确性

不会出现[L,r]在[l[x],r[x]]外与当前区间没有交集的情况

首先在根节点处[L,r]和区间显然有交集

然后运用数学归纳法的思路 说明当前节点区间和[L,r]有交集的时候 递归插入儿子也是保证和儿子区间有交集的

这样只要执行插入函数就有交集 就能保证程序正确性

给出所有和当前区间有交集的情况图 可以发现经过if语句判断 递归插入都保证还是和儿子区间有交集

(黑色为当前区间 红色为欲染色区间 一共6种情况)

不难分析出这个插入函数的复杂度是O(N)级别的(需要遍历子树) 从常数上看比朴素还慢

但是不覆盖子树上的区间又会产生错误 我们需要对插入进行改进

改进后 我们的n[]数组不单记录一个节点的颜色 而是记录的子树的颜色

我们看具体操作

*如果当前区间已经染色且颜色和欲染色一致 则直接退出(这句话可以不要)

*如果当前区间被完全覆盖 就说明子树也被完全覆盖了 直接给当前节点染色退出

*如果没有被完全覆盖

  -就给先给左右儿子染色成当前节点的颜色 然后当前节点赋值为混合颜色=0

  -然后再递归染色左右子树

这样修改完全覆盖的区间时就可以直接修改然后退出 不用遍历子树了

而没有完全覆盖时 需要把颜色先下传给左右子树 再递归修改 保证子树颜色的正确性

这样我们访问的区间总数就降到了O(LogN)级别个 比O(N)好了不少

这个其实是一种最原始的Lazy-Tag思想

这种思想很重要 也比较难掌握 我们以后详细讨论

给出改进后的代码


void update(int L,int r,int color,int id){
	int mid=(post[id].r+post[id].L)>>1;
	if(post[id].L==L&&post[id].r==r){
		post[id].color=color;
		return;
	}
	if(post[id].color==color)
		return;
	if(post[id].color>0){
		post[id<<1].color=post[id<<1|1].color=post[id].color;
		post[id].color=0;
	}

	if(r<=mid)
		update(L,r,color,id<<1);
	else if(L>mid)
		update(L,r,color,id<<1|1);
	else{
		update(L,mid,color,id<<1);
		update(mid+1,r,color,id<<1|1);
	}
}

最后就是统计了

 

统计相对很简单 一共30种颜色 用个Simple Hash即可

这时候我们记录的混合颜色就有用了 用于判断

结构和插入差不多 不过递归的条件不再是是否有交集而是是否为空节点


void query(int L,int r,int id){
	int mid=(post[id].L+post[id].r)>>1;
	if(post[id].color>0){
		visit[post[id].color]=1;
		return;
	}
	if(r<=mid)
		query(L,r,id<<1);
	else if(L>mid)
		query(L,r,id<<1|1);
	else{
		query(L,mid,id<<1);
		query(mid+1,r,id<<1|1);
	}
}

最后是我的AC代码

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
#define N 450000
struct node{
	int L,r;
	int color;
}post[N<<2];

bool visit[50];
void Build(int L,int r,int id){
	post[id].L=L;
	post[id].r=r;
	post[id].color=1;
	if(L!=r){
		int mid=(L+r)>>1;
		Build(L,mid,id<<1);
		Build(mid+1,r,id<<1|1);
	}
}
void update(int L,int r,int color,int id){
	int mid=(post[id].r+post[id].L)>>1;
	if(post[id].L==L&&post[id].r==r){
		post[id].color=color;
		return;
	}
	if(post[id].color==color)
		return;
	if(post[id].color>0){
		post[id<<1].color=post[id<<1|1].color=post[id].color;
		post[id].color=0;
	}

	if(r<=mid)
		update(L,r,color,id<<1);
	else if(L>mid)
		update(L,r,color,id<<1|1);
	else{
		update(L,mid,color,id<<1);
		update(mid+1,r,color,id<<1|1);
	}
}
void query(int L,int r,int id){
	int mid=(post[id].L+post[id].r)>>1;
	if(post[id].color>0){
		visit[post[id].color]=1;
		return;
	}
	if(r<=mid)
		query(L,r,id<<1);
	else if(L>mid)
		query(L,r,id<<1|1);
	else{
		query(L,mid,id<<1);
		query(mid+1,r,id<<1|1);
	}
}
int main(){
	int L,v,n,a,b,c,i,j;
	char tmp[3];
	int sum=0;
	while(scanf("%d%d%d",&L,&v,&n)!=EOF){
		
		Build(1,L,1);
		for(i=0;i<n;i++){
			scanf("%s",tmp);
			if(tmp[0]=='P'){
				scanf("%d%d",&a,&b);
				sum=0;
				memset(visit,0,sizeof(visit));
				query(a,b,1);
				for(j=1;j<=v;j++)
					if(visit[j])
						sum++;
				printf("%d\n",sum);
			}else{
				scanf("%d%d%d",&a,&b,&c);
				update(a,b,c,1);
			}
		}
	}
}


 


posted @ 2013-11-22 19:56  Teemo的技术blog  阅读(335)  评论(0编辑  收藏  举报