【备忘】(可持久化)线段树

防止遗忘,好记性不如烂博文(雾

线段树

这年头怎么在哪儿码题都能碰到这玩意儿

线段树(\(\text{Segment tree}\))可谓是 \(\text{OIer}\) 们的家常便饭,应用于维护区间信息(需满足结合律)。另外别跟我拿树状数组和它比。

从小见大,边看题边学习~

维护区间和

(洛谷 \(\text{P3372}\) 【模板】线段树 \(\text{1}\)

题目描述

已知一个数列,你要进行下面两种操作:

  1. 将某区间每一个数加上 \(\text{x}\)
  2. 求出区间和。

输入格式

第一行包含两个整数 \(\text{n, m}\),分别表示该数列数字的个数和操作的总个数。

第二行包含 \(\text{n}\) 个用空格分隔的整数,其中第 \(\text{i}\) 个数字表示数列第 \(\text{i}\) 项的初始值。

接下来 \(\text{m}\) 行每行包含 \(\text{3}\)\(\text{4}\) 个整数,表示一个操作,具体如下:

操作 \(\text{1}\): 格式:\(\text{1 x y k}\) 含义:将区间 \(\text{[x,y]}\) 内每个数加上 \(\text{k}\)

操作 \(\text{2}\): 格式:\(\text{2 x y}\) 含义:输出区间 \(\text{[x,y]}\) 内每个数的和。

输出格式

输出包含若干行整数,即为所有操作 \(\text{2}\) 的结果。

基本的建树

线段树是一棵平衡二叉树,根节点维护全区间,然后往下对半分(即每个节点都存了条线段)。不保证所有的区间都是线段树的节点。当然还要依题存区间和啊什么的值。

编号为 \(\text{k}\) 的节点,左右儿子节点编号分别为 \(\text{k << 1, k << 1 | 1}\),若节点 \(\text{k}\) 存储区间 \(\text{[l,r]}\) 的和,则左右儿子节点分别存储区间 \(\text{[l, mid]}\)\(\text{mid + 1, r}\) 的和,其中 \(\text{mid = l + r >> 1}\),左节点存储区间长度,与右节点相同或多 \(\text{1}\)

build1

递归建立线段树:

void build (int l, int r, int p) {
    if (l == r) { // 叶子结点
        t[p] = a[l]; // 直接取数组值
        return ;
    }
    int mid = l + r >> 1;
    build (l, mid, p << 1);
    build (mid + 1, r, p << 1 | 1); // 建立儿子节点
    t[p] = t[p << 1] + t[p << 1 | 1]; // 本节点值为儿子节点和
}

区间修改

引入懒标记,朴素想法为使用递归一层层修改,但复杂度较高。使用懒标记后,对于恰好是线段树节点的区间,直接打上标记,不用递归,等用到他的子区间时,向下传递。

void upd (int cl, int cr, int d, int p = 1, int l = 1, int r = n) {
	// 参数意义:最初修改的区间,修改值,当前分出来的区间所在的节点
    if (l > cr or r < cl) { // 区间无交集
        return ;
    }
    if (l >= cl and r <= cr) {
        // 直接在区间节点上加,其实换成 == 没影响
        t[p] += (r - l + 1) * d;
        if (r > l) tag[p] += d;
        return ;
    }
    int mid = l + r >> 1;
    tag[p << 1] += tag[p]; // 传递标记
    tag[p << 1 | 1] += tag[p];
    t[p << 1] += tag[p] * (mid - l + 1);
    t[p << 1 | 1] += tag[p] * (r - mid); // 向下更新
    tag[p] = 0; // 清除标记
    upd (cl, cr, d, p << 1, cl, mid);
    upd (cl, cr, d, p << 1 | 1, mid + 1, r); // 重复步骤,继续向下更新
    t[p] = t[p << 1] + t[p << 1 | 1]; //更新当前节点
}

中间有一段常被习惯性地封装:

inline void push_down (int p, int len) {
    tag[p << 1] += tag[p]; // 传递标记
    tag[p << 1 | 1] += tag[p];
    t[p << 1] += tag[p] * (len - len / 2);
    t[p << 1 | 1] += tag[p] * (len / 2); // 向下更新
    tag[p] = 0; // 清除标记
}

然后直接在 \(\text{upd}\) 函数里调用:

push_down (p, r - l + 1);

单点修改。。。让修改区间左右端点相等即可。

区间查询

跟上面差不多

int query (int ql, int qr, int p = 1, int l = 1, int r = n) {
    if (l > qr or r < ql) return ;
    if (ql <= l and qr >= r) return t[p];
    int mid = l + r >> 1;
    push_down (p, r - l + 1);
    return query (ql, qr, p << 1, l, mid) +
    query (ql, qr, p << 1 | 1, mid + 1, r);
}

没了。

实际上线段树还可以维护区间最值、区间 \(\text{gcd}\) 等等,操作除了区间加也可以是区间乘、区间赋值,了解原理后很容易改。


主席树

真名其实是可持久化线段树,之所以叫它主席树。。。

由于发明者黄嘉泰姓名的缩写与前中共中央***、国家主席(已被博客园和谐)(H.J.T.)相同,因此这种数据结构也可被称为***树或主席树。

From Wikipedia.org

可持久化意思是我们可访问历史版本。

(关于文中的代码,由于我自己并没有将代码编译运行所以不保证它们是对的,如有错误欢迎帮忙指正)

主席树结构

主席树支持查询历史版本(每次操作都会使版本更新)。传统的暴力思路是每次操作都进行一次备份,但毫无疑问 \(\text{MLE}\),所以只好利用某种方法进行压缩。

下面我们从小问题入手,先思考一棵单点修改区间查询的线段树的可持久化方法。

此时对下标为 \(\text{3}\) 的节点进行操作,如何产生新版本,并保留旧版本?

众所周知,操作单点最多会使线段树的 \(\text{log n}\) 个节点被修改,那么考虑这 \(\text{log n}\) 个节点。我们动态开点,修改 \(\text{3}\),并把经过的点全部拷贝一份,然后把空的左右儿子连到原本的地方。

差不多就跟分层图一样。

这样每次操作最多开 \(\text{log n}\) 个节点,若有 \(\text{k}\) 次操作,则空间也就 \(\text{n long n + k log n}\)

以下是示例代码:

#define N 100010
#define ls(x) 
#define rs(x) 
#define mid (l + r >> 1)

struct blanc {
    int ls, rs, sum;
} t[N << 4]; // 这里请注意空间大小
int a[N], tot;

int build (int l, int r) {
    int x = ++tot;
    if (l == r) return x;
    t[x].ls = build (l, mid);
    t[x].rs = build (mid + 1, r);
    return x;
}
/* 下面的 update 函数与平常的线段树略有不同 */
int upd (int k, int l, int r, int pre, int w) {
    int x = ++tot;
    /* 复制信息 */
    t[x] = t[pre];
    /* 新版本更新 */
    t[x].sum += w;
    if (l == r) return x;
    if (k <= mid) t[x].ls = upd (k, l, mid, t[pre].ls, w);
    else t[x].rs = upd (k, mid + 1, r, t[pre].rs, w);
    return x;
}

用武之地

区间第 k 小问题

我们维护数字出现次数的前缀和,然后复刻权值线段树的操作,顺着次数的大小关系找出第 \(\text{k}\) 大(其实是大还是小都是一样的做法),代码如下:

int query (int l, int r, int pre, int now, int k) {
    int w = sum[t[now].ls] - sum[t[pre].ls];
    if (l == r) return l;
    if (k <= w) return query (l, mid, t[pre].ls, t[now].ls, k);
    return query (mid + 1, r, t[pre].rs, t[now].rs, k - w);
}

排列的区间交集

当然在离散化的前提下,不是排列也能给他变成排列(bushi

我们设有排列 \(\text{A|1 - n|}\) 和排列 \(\text{B|1 - m|}\)

\(\text{A}\) 中的数字的出现位置记下,\(\text{pos[A[i]] = i}\),然后将 \(\text{B}\) 放入主席树进行维护。每次将 \(\text{B}\) 中的数字按顺序,以 \(\text{pos[B[i]]}\) 为坐标放入主席树。在回答 \(\text{A[l - r]}\cap\text{B[L - R]}\) 时,用 \(\text{R}\) 版本查询 \(\text{[l - r]}\) 的数字出现次数前缀和,减去 \(\text{L - 1}\) 版本查询 \(\text{[l - r]}\) 的数字出现次数前缀和,即可知两端区间交集元素个数。

int query (int ql, int qr, int l, int r, int p) {
    if (ql <= l and r <= qr) return t[p].sum;
    int mid = (l + r) >> 1, ans = 0;
    if (ql <= mid) ans = query (ql, qr, l, mid, t[p].ls);
    if (mid < qr) ans += query (ql, qr, mid + 1, r, t[p].rs);
    return ans;
}

inline int inquire (int l1, int r1, int l2, int r2) {
    return query (l1, r1, 1, n, rt[r2]) - query (l1, r1, 1, n, rt[l1 - 1]);
}

inline void build (int a[], int b[], int n, int m) {
    int pos[n];
    for (int i = 1; i <= n; i++) pos[a[i]] = i;
    for (int i = 1; i <= m; i++) rt[i] = upd (pos[b[i]], 1, n, rt[i - 1], 1);
}
posted @ 2021-09-29 16:23  aleph_blanc  阅读(64)  评论(0编辑  收藏  举报