【数据结构系列】线段树(Segment Tree)

一、线段树的定义

  线段树,又名区间树,是一种二叉搜索树。

  那么问题来了,啥是二叉搜索树呢?

  对于一棵二叉树,若满足:

①它的左子树不空,则左子树上所有结点的值均小于它的根结点的值

②若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值

③它的左、右子树也分别为二叉搜索树

  那么这就是一棵二叉搜索树。

  扯完废话,再回到线段树这里。顾名思义,线段树就是由线段构成的树,它大概长成这样:

  对于每一棵线段树上的节点,都有三个值:左区间、右区间以及权值。(当然,在某些情况下它只有左右区间,这个时候线段树只是作为维护某个值而使用的数据结构,如扫描线)

  线段树有一个非常重要的性质,就是当父亲节点的区间为[x,y]时,左孩子的区间就必定为[x,(x+y)/2],右孩子的区间必定为[(x+y)/2+1,y]

二、线段树的基本操作

   常见的应用在竞赛中的操作分为:建树,单点修改,区间求和,查询区间最值,区间修改

  我们先从建树开始讲起。

1.线段树的建树

  线段树的建树是采用递归写法来构建的。其核心思想就是:

  递归左子树,递归左子树的左子树...递归到左子树的叶子结点,然后回溯到叶子结点的父节点的右子树...以此类推。在每一次递归到叶子结点的时候就给该节点赋值(输入或者0之类的)。

  建树的伪代码很容易得出:

1 void Build() {
2     if(是叶子节点) 赋值
3     else {
4         递归左子树;
5         递归右子树;
6     }      
7 }

    那么问题出在这里:怎么判断是叶子结点?怎么递归左右子树?现在,往上翻,看看线段树的性质。至于叶子节点的判断,我们也可以利用线段树的性质。叶子结点没有子节点,那么它的左右区间必定相同(即一个点而不是一条线段),否则可以继续向下递归。

  另外,线段树是一棵满二叉树,所以满足满二叉树一个性质:父亲节点编号为a,那么左子树编号为2*a,右子树编号为2*a+1

  知道了这些性质,建树就很好写了。

 

 1 /*i表示当前递归编号,l,r分别表示当前点的左右区间*/
 2 /*Tree数组是存储线段树的数组*/
 3 void Build(int i, int l, int r) {
 4      if(l == r) {
 5          scanf("%d", Tree[i])
 6          return;
 7      }
 8      int Mid = (l + r) / 2;
 9      Build(i * 2, l, Mid);
10      Build(i * 2, Mid + 1, r);
11      PushUp(i) /*这是什么?往后看*/      
12 }

   怎么样?很简单吧!

2.线段树的单点修改

  接下来来讲讲线段树最基本操作之一 -- 单点修改。(前面讲了怎么递归左右子树,这里不再赘述)

  单点修改在题目中一般以 "给定两个数A, B,将树上第A个修改为B"的形式存在。你可能认为:"这不是很Easy吗?",然后立马敲下了这一段代码。

Tree[A] = B

  这么写就大错特错了!因为这里的"Tree[A]"不一定是我们需要找的那个'A',这么写的话会导致整棵树结构被打乱。

  特别提醒:线段树中的修改操作一定只能使用特别的操作来完成,千万不要自以为是的写一些似乎是对的代码

  那么怎么做呢?我们来分析一下。

  如果要找到这个点A,我们必须要递归左右子树来寻找。上面介绍了递归的方法,大家是否已经发现了这样的递归很像某一种算法?没错,就是分治(如果要理解成二分也没有问题),那么问题就很显然了,每次都二分,如果要寻找的点A在当前区间的中点,即(l+r)/2之前,就递归左子树,否则递归右子树。那么写成伪代码是这样的

void Quary_Single() {
  if(找到改点) 修改
  if(查找点在当前区间前半部分) 递归左子树
  else 递归右子树  
}

 

  这些操作我都介绍过了,那么写成真正的代码也不会很难吧。

 

 1 /*i为当前编号,L,R为左右区间,A为修改点的编号,B为修改的值*/
 2 void Update_Single(int i, int L, int R, int A, int B) {
 3     if(L == R) {
 4          /*如果找到了,修改值*/
 5          Tree[i] == B;
 6          return;
 7      }
 8      int Mid = (L + R) / 2;
 9      if(A <= Mid) Update_Single(i * 2, L, Mid, A, B); /*递归左子树*/
10      else Update_Single(i * 2 + 1, Mid + 1, R, A, B); /*递归右子树*/
11      PushUp(i); /*这是什么?往后看*/
12  }

  大家应该都有一个想法吧:单点修改也不过如此。

  的确,不过如此

3.线段树的区间求和

  首先我要介绍一个东西,叫做 "PushUp"函数。这个函数的作用是什么呢?应该有很多人都想到了,就是将子节点的信息"传"给父亲节点。具体写起来也不难,我们可以将PushUp函数当做前缀和来处理(其实方便区间和,如果要求区间最值,PushUp函数就是处理最值了)

  代码大约是这样:

/*区间最值处理*/
void PushUp(int Now) {
    Tree[Now] = Max(Tree[Now * 2], Tree[Now * 2 + 1]);
}
/*区间和处理*/
void PushUp(int Now) {
    Tree[Now] = Tree[Now * 2] + Tree[Now * 2 + 1];
}

  这个东西要在什么地方加上呢?要在建树以及修改之后,也就是上述的两个操作之后。。

  那么来讲讲区间求和问题吧。区间求和其实非常简单,我们只需要查询给定的区间,然后找到这个区间里面的所有叶子结点,把叶子结点的权值加起来,得到的结果就是我们所需要的区间和。那么要PushUp干嘛呢?PushUp简化了这个过程。在原本的操作里,最差的情况是要递归一直到叶子结点,多么令人心痛的浪费时间!然而我们用PushUp预处理之后,就变成了前缀和问题,求和不就是小菜一碟吗?

  给出伪代码

   

int Quary_Total() {
    if(在查询区间内) 返回当前权值
    if(当前区间中点在查询区间的右边) 遍历左子树,并求和
    if(当前区间中点在查询区间的左边) 遍历右子树,并求和
    return 答案
}

  真代码不需要我多说了吧。

 

1 /*i 为当前编号, L, R为查询区间*/
2 int Quary_Total(int i, int L, int R, int l, int r) {
3      if(l >= L && r <= R) return Tree[i]; /*如果在区间内*/
4      int Mid = (L + R) / 2, Cnt = 0; /*初始化*/
5      if(L <= Mid) Cnt += Quary_Total(i * 2, L, R, l, Mid); /*递归左子树*/
6      if(R > Mid)  Cnt += Quary_Total(i * 2 + 1, L, R, Mid + 1, r); /*递归右子树*/
7      return Cnt;
8  }

  就是这么简单。

4.线段树的区间最值

   其实区间最值完全可以放在区间和里面讲的,因为写法几乎一样,唯一不同的是PushUp的方式以及判断的方式。因为在PushUp的时候预处理每一棵子树的最值,所以真正处理区间时只要把上面一层扫过去就可以了。

  真代码直接上:)

 

int Quary_RMQ(int i, int L, int R, int l, int r) {
     if(l >= L && r <= R) return Tree[i];
     int Mid = (L + R) / 2, Cnt = 0;
     int A, B;
     A = Quary_RMQ(i * 2, L, R, l, Mid);
     B = Quary_RMQ(i * 2 + 1, L, R, Mid + 1, R);
     return Max(A, B); /*返回最大值*/
 }

  那么线段树的四大基本操作就这么讲完了

三、线段树的优势和劣势

  线段树的优势和劣势都很明显。

优势:时间快,操作多

  线段树的优势首先是时间快,上文也讲过,线段树的所有操作都是基于分治算法,再经过PushUp优化,整个算法就变得十分稳定。比起一般的数组暴力算法,线段树是明显更优的。看下表就知道

    

  当然,在一些时候它也会劣于下面两种算法,不过是在极少数时候。

  另外,它操作多样化,比起树状数组,多了区间最值一种操作。  

劣势:空间浪费

  上面也介绍过了,线段树一直是一棵满二叉树,所以无论如何,它所开的空间必须是四倍。但是在某些情况,线段树会浪费三倍的空间(只有一条链等),但你又不能省掉这三倍空间,还是得苦逼的开四倍。

  和树状数组比起来,一棵普通的线段树是树状数组空间的四倍。

四、总结

  线段树是一种区间存储结构,操作基本都有一个固定的模板,所以对于OIer的编码能力要求并不强,只要掌握了,基本就是小菜一碟。只要注意空间上的问题,其他都没什么困难的。

   谢谢大家的收看!如有不对之处请指出! :)

  本文作者: $xiaoyao24256$

posted @ 2017-03-20 20:57  xiaoyao24256  阅读(5428)  评论(1编辑  收藏  举报