Splay简易教程

百度百科
伸展树（Splay Tree），也叫分裂树，是一种二叉排序树，它能在O(log n)内完成插入、查找和删除操作。它由丹尼尔·斯立特Daniel Sleator 和罗伯特·恩卓·塔扬Robert Endre Tarjan 在1985年发明的。
在伸展树上的一般操作都基于伸展操作：假设想要对一个二叉查找树执行一系列的查找操作，为了使整个查找时间更小，被查频率高的那些条目就应当经常处于靠近树根的位置。于是想到设计一个简单方法，在每次查找之后对树进行重构，把被查找的条目搬移到离树根近一些的地方。伸展树应运而生。伸展树是一种自调整形式的二叉查找树，它会沿着从某个节点到树根之间的路径，通过一系列的旋转把这个节点搬移到树根去。
它的优势在于不需要记录用于平衡树的冗余信息。

简介
二叉排序树（Binary Sort Tree）又称二叉查找树（Binary Search Tree），亦称二叉搜索树。
二叉排序树或者是一棵空树，或者是具有下列性质的二叉树：
若左子树不空，则左子树上所有结点的值均小于或等于它的根结点的值；
若右子树不空，则右子树上所有结点的值均大于或等于它的根结点的值；
左、右子树也分别为二叉排序树
同样的序列，因为排序不同，可能会生成不同的二叉排序树，查找效率性对就不一定了。如果是二叉排序树退化成一条链，效率就很低。
伸展树（Splay）是一种平衡二叉树，即优化后的二叉查找树。伸展树可以自我调整，这就要依靠伸展操作Splay(x,S)，使得提升效率。
变量定义
N：常量，节点个数。
ch[N][2]：二维数组，ch[x][0]代表x的左儿子，ch[x][1]代表x的右儿子。
val[N]：一维数组，val[x]代表x存储的值。
cnt[N]：一维数组，cnt[x]代表x存储的重复权值的个数。
par[N]：一维数组，par[x]代表x的父节点。
size[N]：一维数组，size[x]代表x子树下的储存的权值数（包括重复权值）。
各种操作
chk操作
辅助操作，查询一个节点位于其父节点的方向。

int chk(int x) {
    return ch[par[x]][1] == x;
}

pushup操作

辅助操作，更新size数组的值。

void pushup(int x) {
    size[x] = size[ch[x][0]] + size[ch[x][1]] + cnt[x];
}

比如最开始的树是这样子的：

现在我们想把2号点搞到4号点的位置。
那么2下面的子树就有1,3,4,5。一种比较优秀的玩法是这样的：

那么我们可以考虑这么操作：

先把4→2的边改成4→3。
再把6→4的边改成6→2。
最后把2→3的边改成2→4。
第一次连边

第二次连边

第三次连边

连边前(原图)

旋转操作有四种。自行模拟后发现：

旋转后，父节点会将连向需旋转的该子节点的方向的边连向该子节点位于其父节点方向的反方向的节点。
令x = 该节点, y = par[x], k = chk(x), w = ch[x][k^1]，则ch[y][k] = w; par[w] = y;
旋转后，爷爷节点会将连向父节点的边连向需旋转的该节点。
ch[z][chk(y)] = x; par[x] = z;
旋转后，需旋转的该节点会将连向该子节点位于其父节点方向的反方向的子节点的边连向其父节点。
ch[x][k^1] = y; par[y] = x;
综合一下，得到下列代码(可见自然语言是多么的无力)：

void rotate(int x) {
    int y = par[x], z = par[y], k = chk(x), w = ch[x][k^1];
    ch[y][k] = w; par[w] = y;
    ch[z][chk(y)] = x; par[x] = z;
    ch[x][k^1] = y; par[y] = x;
    pushup(y); pushup(x);
}

伸展(splay)

将一个节点一路rotate到指定节点的儿子。
注意，如果该节点、该父节点和该爷爷节点「三点一线」，那么应该先旋转父节点。
此处进行的操作是将3 splay到根节点。

旋转父节点后

旋转自身后

并且注意处理爷爷节点已经是目标的情况。

void splay(int x, int goal = 0) {
    while (par[x] != goal) {
        int y = par[x], z = par[y];
        if (z != goal) {
            if (chk(x) == chk(y)) rotate(y);
            else rotate(x);
        }
        rotate(x);
    }
    if (!goal) root = x;
}

find操作

辅助操作，将最大的小于等于x的数所在的节点splay到根。

void find(int x) {
    if (!root) return;
    int cur = root;
    while (ch[cur][x > val[cur]] && x != val[cur]) {
        cur = ch[cur][x > val[cur]];
    }
    splay(cur);
}

插入(insert)

从根节点开始，一路搜索下去。如果节点存在则直接自增cnt的值。否则新建节点并与父节点连边。
因为新建节点时可能会拉出一条链，所以新建节点后需要将该节点splay到根节点。沿途的rotate操作可以使平衡树恢复平衡。

void insert(int x) {
    int cur = root, p = 0;
    while (cur && val[cur] != x) {
        p = cur;
        cur = ch[cur][x > val[cur]];
    }
    if (cur) {
        cnt[cur]++;
    } else {
        cur = ++ncnt;
        if (p) ch[p][x > val[p]] = cur;
        ch[cur][0] = ch[cur][1] = 0;
        val[cur] = x; par[cur] = p;
        cnt[cur] = size[cur] = 1;
    }
    splay(cur);
}

查询k大(kth)

从根节点开始，一路搜索下去。每次判断要走向哪个子树。注意考虑重复权值。

int kth(int k) {
    int cur = root;
    while (1) {
        if (ch[cur][0] && k <= size[ch[cur][0]]) {
            cur = ch[cur][0];
        } else if (k > size[ch[cur][0]] + cnt[cur]) {
            k -= size[ch[cur][0]] + cnt[cur];
            cur = ch[cur][1];
        } else {
            splay(cur);
            return cur;
        }
    }
}

查询rank(rank)

并不需要专门写操作。将该节点find到根后返回左子树的权值数即可。

find(x);
printf("%d\n", size[ch[root][0]]);

前驱(pre)

将该节点find到根后返回左子树最右边的节点即可。

int pre(int x) {
    find(x);
    if (val[root] < x) return root;
    int cur = ch[root][0];
    while (ch[cur][1]) {
        cur = ch[cur][1];
    }
    splay(cur);
    return cur;
}

后继(succ)

同理，返回右子树最左边的节点即可。

int succ(int x) {
    find(x);
    if (val[root] > x) return root;
    int cur = ch[root][1];
    while (ch[cur][0]) {
        cur = ch[cur][0];
    }
    splay(cur);
    return cur;
}

删除(remove)

显然，任何一个数的前驱和后继之间只有它自身。
令该点的前驱为last，后继为next。
那么可以考虑把前驱splay到根，后继splay到前驱的右儿子，那么后继的左儿子就是要删除的点。

最后判特判权值数大于的情况即可。

void remove(int x) {
    int last = pre(x), next = succ(x);
    splay(last); splay(next, last);
    int del = ch[next][0];
    if (cnt[del] > 1) {
        cnt[del]--;
        splay(del);
    }
    else ch[next][0] = 0;
    pushup(next), pushup(x);
}

为什么旊转要有单旋，一字旋，之字旋呢？

如果让我们自己设计伸展树查找后的伸展策略，目标是将查找到的节点调整到根节点的位置，我们的第一想法很简单，直接单旋转就好了，也就两种情况，一直循环到被查到的节点到根节点便是，但是这种做法会把不是被查找节点推到和原来被查询节点差不多的位置。一个简单的例子就是查询只有左子树的有序二叉查找树1,2……，9， 1. 如果我们查询1，则1需要9次比较，查询结束后，将1逐步单旋转到树根位置，此时的树形是1为树根只有右孩子9,9节点只有左子树。 2. 如果继续查询2，则也需要9次比较，查询结束后使用单旋转将2转到树根位置 3. 如果继续查询节点3，则需要8次比较。
也就是说以此类推，如果节点数是N的话，我们需要次查询时间。这种简单的旋转虽然把查询的节点推到的根节点，单也把其他节点推到了和它相似的深度，我们想以何种方法即可以即可以把根节点推到树根的位置，又可以进可能减少其他节点被推的深度，于是我们有了伸展的旋转方式。
那么这种旋转的改变会带来哪些不一样的结果？我们用原来的例子来解释，如1-7的树对1进行查询后按伸展方式进行旋转，其结果如图3-1所示，在将1推到根的情况下，这个树的高度在降低，其他的节点并没有因为1成为树根而被推到更深的位置，而我们看图3-2，仅使用单次旋转的简单旋转的结果，其深度并没有发生改变，而所有节点的深度都因为1成为根加了1.

图3-1：伸展方式旋转结果

图3-2：简单旋转方式的结果

posted @ 2022-03-16 21:14 心悟&&星际阅读(209) 评论(0) 收藏举报

刷新页面返回顶部

Splay简易教程

公告