【进阶】树状数组的高阶应用

1. 离线树状数组

介绍

有一类经典问题:给定一个序列,每次询问一个区间内的元素种类数。

这种题的做法有很多:莫队、分块、主席树……在不强制在线的情况下,他们的效率都较低,有一种效率高、空间小的离线做法:离线树状数组

例题:

P1972 [SDOI2009] HH的项链

题目大意

给定一个长度为 \(n\) 的序列 \(a\)\(m\) 次询问,每次询问一个区间 \([l, r]\) 内的元素种类数。

数据范围:\(n, m\le 10^6\)

思路

\(10 ^ 6\) 的数据范围直接劝退大多数根号数据结构,主席树还能跑,但效率也挺低的,而且空间占用极大,这里就可以用离线树状数组来做。

我们首先可以推出来一个结论:对于若干个右端点都为 \(r\) 的查询区间 \([l, r]\),那么对于多次出现的数我们只关心靠右的那个数,因为只用统计有几个数出现过,反正都被算过一次了,那么靠右位置的完全可以取代左边位置的。

我们先把所有操作离线下来,钦定一个扫描顺序。根据上面的结论,应该把所有操作按照右端点升序排列。

根据上述方式,维护一个数组 \(c\),当我们将 \(1\sim nowr\) 的数加入计算后,在每个数最后出现的位置打上一个 \(1\) 的标记,表示这个位置上出现了一个新的数。

那么对 \(c\) 求一遍前缀和得到 \(sum\)\(sum_i\) 就表示 \(1\sim i\) 中出现了多少个数,对于每个询问 \([l, r]\) 答案就是 \(sum_r - sum_{l - 1}\)

树状数组刚好能支持单点修改,区间求和,所以直接用树状数组维护数组 \(c\) 即可。

时间复杂度 \(O(n\log n)\)(假定 \(n,m\) 同级)。

\(\texttt{Code:}\)

#include <iostream>
#include <algorithm>

#define lowbit(x) x & -x

using namespace std;

const int N = 1000010;
int n, m;
int a[N], pre[N]; //pre[i] 表示 i 上一次出现的位置

struct BIT{ //封装的树状数组
    int c[N];
    void add(int x, int y) {
        for(; x < N; x += lowbit(x)) c[x] += y;
    }
    int ask(int x) {
        int res = 0;
        for(; x; x -= lowbit(x)) res += c[x];
        return res;
    }
}tr;

struct node{
    int id, l, r;
    bool operator< (const node &o) const {
        return r < o.r;
    }
}q[N];
int ans[N];

int main() {
    scanf("%d", &n);
    for(int i = 1; i <= n; i++) scanf("%d", &a[i]);
    scanf("%d", &m);
    int l, r;
    for(int i = 1; i <= m; i++) {
        scanf("%d%d", &l, &r);
        q[i] = {i, l, r};
    }
    sort(q + 1, q + m + 1);
    int nowr = 1;
    for(int i = 1; i <= m; i++) {
        while(nowr <= q[i].r) { //一直加数直到达到当前查询的右端点
            if(pre[a[nowr]]) tr.add(pre[a[nowr]], -1);
            tr.add(nowr, 1);
            pre[a[nowr]] = nowr; //nowr 将要右移,当前应成为过去
            nowr++;
        }
        ans[q[i].id] = tr.ask(q[i].r) - tr.ask(q[i].l - 1);
    }
    for(int i = 1; i <= m; i++)
        printf("%d\n", ans[i]);
    return 0;
}

P4113 [HEOI2012] 采花

题目大意:

给定一个长度为 \(n\) 的序列 \(a\)\(m\) 次询问,每次询问一个区间 \([l, r]\) 中出现次数 \(\ge 2\) 的数。

数据范围:\(n, m\le 2\times 10^6\)

思路

从数据范围可看出本题及其毒瘤,貌似只有离线树状数组和离线权值线段树能过。

和上一道题的大体思路差不多,但由于这次要维护出现次数 \(\ge 2\) 的数,所以需要 \(pre1\)\(pre2\) 两个数组分别储存 \(i\) 上一次出现的位置和上上次出现的位置。

和上一题不同的是,标记应该打在 \(pre1_{a_{nowr}}\) 上,而不是 \(nowr\) 上。因为当一个区间同时包含 \(pre1_{a_{nowr}}\)\(nowr\) 时才能算数。

\(\texttt{Code:}\)

#include <vector>
#include <cstring>
#include <iostream>
#include <algorithm>

using namespace std;

const int N = 2000010;

int n, vmax, m;
int a[N];
int pre1[N], pre2[N];

struct BIT{
    int c[N];
    #define lowbit(x) x & -x
    inline void add(int x, int y) {
        for(; x <= n; x += lowbit(x)) c[x] += y;
    }
    inline int ask(int x) {
        int res = 0;
        for(; x; x -= lowbit(x)) res += c[x];
        return res;
    }
}tr;

struct node{
    int id, l, r;
    inline bool operator< (const node &o) const {
        return r < o.r;
    }
}q[N];
int ans[N];

int main() {
    scanf("%d%d%d", &n, &vmax, &m);
    for(int i = 1; i <= n; i++) scanf("%d", &a[i]);
    int l, r;
    for(int i = 1; i <= m; i++) {
        scanf("%d%d", &l, &r);
        q[i] = {i, l, r};
    }
    sort(q + 1, q + m + 1);
    int nowr = 1;
    for(int i = 1; i <= m; i++) {
        while(nowr <= q[i].r) {
            if(pre2[a[nowr]]) {
                tr.add(pre2[a[nowr]], -1);
                pre2[a[nowr]] = pre1[a[nowr]];
                tr.add(pre1[a[nowr]], 1);
                pre1[a[nowr]] = nowr;
            }
            else if(pre1[a[nowr]]) {
                pre2[a[nowr]] = pre1[a[nowr]];
                tr.add(pre1[a[nowr]], 1);
                pre1[a[nowr]] = nowr;
            }
            else pre1[a[nowr]] = nowr;
            nowr++;
        }
        ans[q[i].id] = tr.ask(q[i].r) - tr.ask(q[i].l - 1);
    }
    for(int i = 1; i <= m; i++)
        printf("%d\n", ans[i]);
    return 0;
}

P10814 【模板】离线二维数点

这里

P2163 [SHOI2007] 园丁的烦恼

这里

posted @ 2024-08-04 19:18  Brilliant11001  阅读(5)  评论(0编辑  收藏  举报