数据结构(四十)平衡二叉树(AVL树)

  一、平衡二叉树的定义

  平衡二叉树(Self-Balancing Binary Search Tree或Height-Balanced Binary Search Tree),是一种二叉排序树,其中每一个结点的左子树和右子树的高度差至多等于1。平衡二叉树是一种高度平衡的二叉排序树,即要么是一棵空树,要么它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。

  将二叉树上结点的左子树深度减去右子树深度的值称为平衡因子BF(Balance Factor),那么平衡二叉树上所有结点的平衡因子只可能是-1、0和1。

  距离插入结点最近的,且平衡因子的绝对值大于1的结点为根的子树,称为最小不平衡树。

  

  二、平衡二叉树的实现原理

  平衡二叉树构建的基本思想就是在构建二叉排序树的过程中,每当插入一个结点时,先检查是否因插入破坏了树的平衡性,若是,则找出最小不平衡树。在保持二叉排序树特性的前提下,调整最小不平衡树中各结点之间的链接关系,进行相应的旋转,使之成为新的平衡子树。

  以数组{3,2,1,4,5,6,7,10,9,8}为例:

  

  

  

  注意的是:

  • 图6到图7,对结点2进行左旋,本来结点3是结点4的左孩子,由于旋转后需要满足二叉排序树的特定,因此结点3最后成了结点2的右孩子。
  • 另外,图11中, 如果对结点7进行左旋的话,结点9就成了结点10的右孩子了,这也是不满足二叉排序树的,根本原因在于结点7的BF值为-2,二结点10的BF值为1,符号并不统一,因此不能直接旋转,所以需要首先把结点10进行右旋,结点10就成了结点9的右孩子,而此时结点7和结点9的符号也统一了,所以以结点7为根进行左旋,最后得到图13。
  • 图14中同理,结点6的BF值为-2,而结点9的BF为1,所以要先以9为根结点右旋,得到图15,然后,此时结点6和结点7的BF值都为负,然后进行左旋即可。

  

  三、平衡二叉排序树的实现

  1.在平衡二叉排序树T上插入一个新纪录x的算法描述

  • 若AVL为空树,则插入一个记录为x的新结点作为T的根结点,树的深度增1
  • 若x的关键字值和AVL树T的根结点的关键字值相等,则不进行插入操作
  • 若x的关键字值小于AVL树的根结点的关键字值,则将x插入在概述的左子树上,并且当插入之后的左子树深度增加1时,分别就下列不同情况进行处理:

  ①若AVL树的根结点的平衡因子为-1(右子树的深度大于左子树的深度),则将根结点的平衡因子调整为0,并且树的深度不变。

  ②若AVL树的根结点的平衡因子为0(左右子树的深度相等),则将根结点的平衡因子调整为1,树的深度同时增加1

  ③若AVL树的根结点的平衡因子为1(左子树的深度大于右子树的深度),则当该树的左子树的根结点的平衡因子为1时需要进行单向右旋;当该树的左子树的根结点的平衡因子为-1时需进行先左旋后右旋。

  • 若x的关键字值大于AVL树的根结点的关键字值,则将x插入在该树的右子树上,并且当插入之后的右子树深度增加1时,分别就不同情况进行处理,同理第三步。

  2.平衡二叉树的右旋操作(左旋同理)

void R_Rotate(BiTree *P)
{ 
    BiTree L;
    L=(*P)->lchild;         /*  L指向P的左子树根结点 */ 
    (*P)->lchild=L->rchild; /*  L的右子树挂接为P的左子树 */ 
    L->rchild=(*P);
    *P=L;                   /*  P指向新的根结点 */ 
}

  

  右旋操作就是:将L的右子树变成P的左子树,然后将P改成L的右子树,最后将L替换为P成为根结点。

void L_Rotate(BiTree *P)
{ 
    BiTree R;
    R=(*P)->rchild; /*  R指向P的右子树根结点 */ 
    (*P)->rchild=R->lchild; /* R的左子树挂接为P的右子树 */ 
    R->lchild=(*P);
    *P=R; /*  P指向新的根结点 */ 
}

  P(1) P(-2) R(0)
/ \ / \ / \
Pl R(0) Pl R(-1) P Rr(0)
    / \ / \ / \ |
   Rl Rr Rl Rr Pl Rl N
                  |
                  N

  左旋操作就是:将R的左子树变成P的右子树,然后将P改成R的左子树,最后将R替换为P成为根结点。

  3.平衡二叉树的左平衡旋转处理与右平衡旋转处理

  • 左平衡旋转处理

  (1)左平衡的四种情况(左子树的高度大于右子树的高度)

情况1:插入位置在t的左子树的左子树,使得l=1,直接将t右旋,最后l=0,t=0
     *        t(+1)        t(+2)               l(0)
     *       /    \    /    \ 右旋处理  /   \
     *      l(0)   R    l(+1)   R ------>    ll    t(0)
     *    /   \         /   \                | / \
     *   ll   lr      ll   lr                N lr R
    |
N 情况4:插入位置在t的左子树的右子树的右子树,使得l=-1,lr=-1,先将l左旋,然后将t右旋,最后lr=0,l=1,t=0
     *        t(+1)       t(+2)             lr(0)
     *       /   \       /    \ /    \
     *     l(-1)  tr   l(-1)  tr 左旋后右旋     l(1)   t(0)
     *    /   \       /   \ ------->    /       /  \
     *  ll    lr(-1)      ll   lr(-1)      ll      N  tr
     *           \
     *          N   情况3(两种情况类似):插入位置在t的左子树的右子树的左子树或右子树使得lr=0,先将l左旋,然后将t右旋,最后lr=0,l=0,t=0
     *         t(+1)         t(+2)         lr(0)
     *       /   \          /   \         /    \
     *      l(-1) tr   l(-1) tr 左旋后右旋 l(0) t(0)
     *    /   \       /   \ ------->    /  \    /  \
     *  ll    lr(1)       ll    lr(0)      ll   lrl N  tr(深度为2)
     *       /   /   \
     *     lrl  lrl  N
     *   情况2(rd的BF为0) 情况2:插入位置在t的左子树的右子树的左子树,使得lr=1,先将l左旋,然后将t右旋,最后lr=0,l=0,t=-1
     *         t(+1)        t(+2)            lr(0)
     *       /   \           /   \         /     \
     *      l(0)  tr   l(-2)    tr 左旋后右旋 l(0)    t(-1)
     *    /   \       /   \ ------->    /  \       \
     *  ll    lr       ll    lr(+1)         ll   N     tr
     *       /
     *      N

  (2)代码实现

  函数被调用时,传入一个需调整平衡性的子树T,由于函数被调用时,其实是已经确认了当前子树是不平衡状态,且左子树的高度大于右子树的高度。也就是说,此时T的根结点应该是平衡因子BF的值大于1的数,即为+2。

/*  对以指针T所指结点为根的二叉树作左平衡旋转处理 */
/*  本算法结束时,指针T指向新的根结点 */
void LeftBalance(BiTree *T)
{ 
    BiTree L,Lr;
    L=(*T)->lchild; /*  L指向T的左子树根结点 */ 
    switch(L->bf)
    { /*  检查T的左子树的平衡度,并作相应平衡处理 */ 
         /**情况1***/
         case LH: /*  新结点插入在T的左孩子的左子树上,要作单右旋处理 */ 
            (*T)->bf=L->bf=EH;
            R_Rotate(T);
            break;
         case RH: /*  新结点插入在T的左孩子的右子树上,要作双旋处理 */ 
            Lr=L->rchild; /*  Lr指向T的左孩子的右子树根 */ 
            switch(Lr->bf)
            { /*  修改T及其左孩子的平衡因子 */ 
                /**情况2***/
                case LH: (*T)->bf=RH;
                         L->bf=EH;
                         break;
                /**情况3***/
                case EH: (*T)->bf=L->bf=EH;
                         break;
                /**情况4***/
                case RH: (*T)->bf=EH;
                         L->bf=LH;
                         break;
            }
            Lr->bf=EH;
            L_Rotate(&(*T)->lchild); /*  对T的左子树作左旋平衡处理 */ 
            R_Rotate(T); /*  对T作右旋平衡处理 */ 
    }
}
  • 右平衡旋转处理

  (1)右平衡的四种情况(同理)

  (2)代码实现

/*  对以指针T所指结点为根的二叉树作右平衡旋转处理, */ 
/*  本算法结束时,指针T指向新的根结点 */ 
void RightBalance(BiTree *T)
{ 
    BiTree R,Rl;
    R=(*T)->rchild; /*  R指向T的右子树根结点 */ 
    switch(R->bf)
    { /*  检查T的右子树的平衡度,并作相应平衡处理 */ 
     case RH: /*  新结点插入在T的右孩子的右子树上,要作单左旋处理 */ 
              (*T)->bf=R->bf=EH;
              L_Rotate(T);
              break;
     case LH: /*  新结点插入在T的右孩子的左子树上,要作双旋处理 */ 
              Rl=R->lchild; /*  Rl指向T的右孩子的左子树根 */ 
              switch(Rl->bf)
              { /*  修改T及其右孩子的平衡因子 */ 
                case RH: (*T)->bf=LH;
                         R->bf=EH;
                         break;
                case EH: (*T)->bf=R->bf=EH;
                         break;
                case LH: (*T)->bf=EH;
                         R->bf=RH;
                         break;
              }
              Rl->bf=EH;
              R_Rotate(&(*T)->rchild); /*  对T的右子树作右旋平衡处理 */ 
              L_Rotate(T); /*  对T作左旋平衡处理 */ 
    }
}

  4.平衡二叉树的插入操作

  插入操作的过程为:

  第一个结点插入时,当前T为空,则新增一个结点,数据域data为给定的值,BF值为0,且taller为真,InsertAVL函数返回值为真。

  接下来的结点插入时,如果树中已经存在于给定值相同的结点,那么将不再插入;如果之前没有插入过,就继续执行插入过程。

  若新结点小于T的根结点的值,则在T的左子树查找,如果递归调用InsertAVL在T的左子树的适当位置插入新结点e,直到返回值为true为止,说明已经建立了新结点并且使得树长高了。

  例如,第一次插入数字3,第二次插入数字2的时候,通过调用if(!InsertAVL(&(*T)->lchild,e,taller))将T的左孩子为指针整体,然后判断3的左孩子为空,接着新建一个结点为3的左孩子结点,将结点的数据域设为2,BF设置0,2的左右孩子设为空,同时taller值为TRUE,说明加入结点成功,使得树长高了。这样就让2称为了3的左孩子。

  如果成功地在左子树插入了新结点e,并且taller返回为TRUE,说明树由于插入新结点而长高了,接下来就判断T的BF值,从而有三种情况,即未插入之前根结点T的BF值为1时说明原来的左子树高,从而需要调用左平衡处理,将taller置为FALSE;BF值为0时说明原来的树等高,这时在左子树插入新结点,使得左子树比右子树高1,将T的BF设为1;BF值为-1时说明原来的左子树比右子树低1,这时在左子树插入新结点使得左右子树登高,因此将根结点的BF值设为0。

  当在右子树插入新结点时,情况和在左子树插入新结点同理。

/*  若在平衡的二叉排序树T中不存在和e有相同关键字的结点,则插入一个 */ 
/*  数据元素为e的新结点,并返回1,否则返回0。若因插入而使二叉排序树 */ 
/*  失去平衡,则作平衡旋转处理,布尔变量taller反映T长高与否。 */
Status InsertAVL(BiTree *T,int e,Status *taller)
{  
    if(!*T)
    { /*  插入新结点,树“长高”,置taller为TRUE */ 
         *T=(BiTree)malloc(sizeof(BiTNode));
         (*T)->data=e; (*T)->lchild=(*T)->rchild=NULL; (*T)->bf=EH;
         *taller=TRUE;
    }
    else
    {
        if (e==(*T)->data)
        { /*  树中已存在和e有相同关键字的结点则不再插入 */ 
            *taller=FALSE; return FALSE;
        }
        if (e<(*T)->data)
        { /*  应继续在T的左子树中进行搜索 */ 
            if(!InsertAVL(&(*T)->lchild,e,taller)) /*  未插入 */ 
                return FALSE;
            if(*taller) /*   已插入到T的左子树中且左子树“长高” */ 
                switch((*T)->bf) /*  检查T的平衡度 */ 
                {
                    case LH: /*  原本左子树比右子树高,需要作左平衡处理 */ 
                            LeftBalance(T);    *taller=FALSE; break;
                    case EH: /*  原本左、右子树等高,现因左子树增高而使树增高 */ 
                            (*T)->bf=LH; *taller=TRUE; break;
                    case RH: /*  原本右子树比左子树高,现左、右子树等高 */  
                            (*T)->bf=EH; *taller=FALSE; break;
                }
        }
        else
        { /*  应继续在T的右子树中进行搜索 */ 
            if(!InsertAVL(&(*T)->rchild,e,taller)) /*  未插入 */ 
                return FALSE;
            if(*taller) /*  已插入到T的右子树且右子树“长高” */ 
                switch((*T)->bf) /*  检查T的平衡度 */ 
                {
                    case LH: /*  原本左子树比右子树高,现左、右子树等高 */ 
                            (*T)->bf=EH; *taller=FALSE;    break;
                    case EH: /*  原本左、右子树等高,现因右子树增高而使树增高  */
                            (*T)->bf=RH; *taller=TRUE; break;
                    case RH: /*  原本右子树比左子树高,需要作右平衡处理 */ 
                            RightBalance(T); *taller=FALSE; break;
                }
        }
    }
    return TRUE;
}

 

  四、平衡二叉排序树的时间复杂度

  平衡二叉排序树使得二叉树排序树的结构更好,从而提高了查找操作的速度。但是使得插入和删除操作复杂化,从而降低了插入和删除操作的速度。因此,平衡二叉树适合于二叉排序树一经建立就很少进行插入和删除操作,而主要是进行查找操作的应用场合中。

  由于平衡二叉树在查找过程中和给定值进行比较的关键字个数不超过树的深度,因此,在平衡二叉树上进行查找的时间复杂度为O(logn)。

posted @ 2018-07-09 22:12  BigJunOba  阅读(640)  评论(0编辑  收藏  举报