莫队

算法介绍

如果有一个序列上的多个区间询问，并且可以离线，且某区间 \([l, r]\) 推到 \([l + 1, r], [l, r + 1], [l - 1, r], [l, r - 1]\) 是比较容易的，那么可以使用一种较好的排序询问方式，使得总端点位移次数达到一个较小的值。

这种排序方式是：考虑对序列分块，对于两个区间，如果块不同，那么按块排序，否则按 \(r\) 排序。

考虑这个位移次数。对于 \(l\)，最坏情况是在块内左右横跳，\(S^2 \times \cfrac{n}{S}\) 的次数，并且这一部分常数小，跑不满。对于 \(r\)，每块内只会从左到右跑一次，\(\cfrac{n}{S} \times n\) 的次数。

将其平衡，那么 \(S\) 取 \(\sqrt n\) 可以达到理论的界 \(n \sqrt n\)。实际上由于常数可以将 \(S\) 调大一些。至于增加和删除操作所花费的时间，乘到总时间里即可。块长可以灵活调整，如果增删时间不同，也可以改块长。

有一个优化一倍常数的方式：对奇数标号的块，\(r\) 从小到大排序，否则从大到小排序。

实现上，通常先扩张区间然后缩小区间，也就是先进行 \(r++, l--\)。然后注意缩小区间的时候要先删除当前指针位置然后移动指针。

树上莫队

考虑树上括号序（进出的时候加入一次括号序）。对于询问：路径 \((s, t)\)，我们分两种情况将其转为括号序上的询问：

\(s\) 是 \(t\) 的祖先。那么 \(tail_t \rightarrow tail_s\)。
两者没有祖先关系，这代表两方括号序上区间不交，假设 \(s\) 在 \(t\) 前面。那么 \(tail_s \rightarrow head_t\)。

括号序内，出现两次的是不在路径上的子树，不做贡献。

如果询问的是点的相关信息，那么注意第二种情况并没有计算入 lca 的贡献。如果询问的是边的相关信息，考虑所有边都放到儿子的位置，这样做就是完全正确的了。

回滚莫队

对于并不支持删除操作的情况，可以这样做：

预处理每一个 \(l\) 到其块末尾 \(tail\) 的信息。
对于某一块内的询问，将 \(r\) 从小到大排序。对于块内的 \(r\) 暴力求解，对于块外的 \(r\) 维护 \([tail + 1,r]\) 的信息，然后和 \([l, tail]\) 合并。

分析时间复杂度：

预处理的时候，每一块从右往左每次需要复制和处理一个长度为 \(1, 2, ..., S\) 的块，总时间复杂度 \(O(nS)\)。
询问的时候，暴力的时间复杂度是 \(O(q_1S)\)。
其他的时间复杂度是 \(O(n\cfrac{n}{S})\)。

容易发现理论上最优复杂度依然是 \(O(n \sqrt n)\)。

对于“合并”的理解：有两种形式，一种是直接一个一个往左扫，这时候空间是很小的，不需要存块后缀信息，而复杂度是依然正确的，就是每次询问加了 \(O(\sqrt n)\)。还有一种就是保存后缀信息，并且合并。如果可以在 \(O(1) \sim O(\sqrt n)\) 的时间复杂度内完成合并，那么也是可以的，可能可以卡时间常数，但是空间复杂度变成了 \(O(n \sqrt n)\)（假设后缀信息的复杂度正比于其长度）。不过目前看好像大多数情况是第一种比较好。

同样，也可以是不支持插入的。（有的题就是删除更好做，用链表维护和 set 里插入的区别这样）。大概就是 \(r\) 从大到小排，然后某一块开始的时候取块首到 \(n\)，然后删两头这样。

joisc 2023 Day 3 C

【题意】

给定一个 \(n\) 个点的树，有一个 \(m\) 个数的序列 \(a\)，\(q\) 次询问，每次求从任意一个点开始走一条树上路径经过 \(a_l \sim a_r\) 中所有点的话，路径上经过至少一次的点数最少是多少。

【分析】

容易发现这题是求区间上点的虚树大小。

方法 1：
考虑莫队。
考虑加入某一个数。
如果直接加入并维护虚树，需要找到虚树上其最近祖先，二分线段树可以做到 \(\log^2\)，但是显然过不去。
考虑虚树性质，可以 dfn 排序然后计算相邻两两距离之和。
如果使用不删除莫队，加入 \(\log\)，用 set 维护，但是注意到这个题只需要查询 kth 的 rank，可以使用权值树状数组代替 set，具体这么做：

查询 rank：直接查询前缀和即可。
查询 kth：考虑树状数组上二分。

树状数组一种二分方式是直接模拟线段树二分（不同之处在于一个能求区间 kth，一个能求全局 kth）

树状数组（记为 \(a\)）长这样，我们考虑初始令 \(now = n, digit = \log_2 n - 1, k = k\)。这个 \(digit\) 的意思就是在哪一位。比如 \(digit = 2\) 就是在第三层（\(4\) 那一层）
如果 \(a_{now - 2^{digit}} \ge k\) 那么向左边走（\(now -= 2^{digit}\)）；否则向右边走（\(k -= a_{now - 2^{digit}}\)）。不管往哪边走，\(digit--\)。
注意 \(n\) 要补到 \(2^n\)，这个空间上要注意一下，但是由于后面的都是 \(0\)，是不需要做其他事情的。

#include<bits/stdc++.h>
using namespace std;
#define int long long
#define f(i, a, b) for(int i = (a); i <= (b); i++)
#define cl(i, n) i.clear(),i.resize(n);
#define endl '\n'
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int, int> pii;
const int inf = 1e9;
//#define cerr if(false)cerr
//#define freopen if(false)freopen
#define watch(x) cerr  << (#x) << ' '<<'i'<<'s'<<' ' << x << endl
void pofe(int number, int bitnum) {
    string s; f(i, 0, bitnum) {s += char(number & 1) + '0'; number >>= 1; } 
    reverse(s.begin(), s.end()); cerr << s << endl; 
    return;
}
template <typename TYP> void cmax(TYP &x, TYP y) {if(x < y) x = y;}
template <typename TYP> void cmin(TYP &x, TYP y) {if(x > y) x = y;}
//调不出来给我对拍！
//use std::array.
int n;
struct szsz {
    int a[100010];
    int lowbit(int x) {return x & -x;}
    void add(int x, int k) {
        while(x <= n) {
            a[x] += k;
            x += lowbit(x);
        }
    }
    int rnk(int x) {
        int res = 0;
        while(x > 0) {
            res += a[x];
            x -= lowbit(x);
        }
        return res;
    }
    int kth(int k) {
        int newn = 1 << ((int)log2(n - 1) + 1);
        int now = newn, dig = log2(newn) - 1; 
    	while(dig >= 0)  {
    		if(a[now - (1 << dig)] >= k) {
    			now -= (1 << dig);
    		}
    		else {
    			k -= a[now - (1 << dig)];
    		}
    		dig--;
    	}
    	return now;
    }
}tr;
signed main() {
    ios::sync_with_stdio(0);
    cin.tie(NULL);
    cout.tie(NULL);
    //freopen();
    //freopen();
    //time_t start = clock();
    //think twice,code once.
    //think once,debug forever.
    cin >> n; int q; cin >> q;
    f(i, 1, q) {
        int op; cin >> op;
        if(op == 1){int x, k; cin >> x >> k; tr.add(x, k);}
        else if(op == 2) {int x; cin >> x; cout << tr.rnk(x) << endl;}
        else {int x; cin >> x; cout << tr.kth(x) << endl;}
    }
    //time_t finish = clock();
    //cout << "time used:" << (finish-start) * 1.0 / CLOCKS_PER_SEC <<"s"<< endl;
    return 0;
}
/*
2023/x/xx
start thinking at h:mm


start coding at h:mm
finish debugging at h:mm
*/

上面的这份代码，在点有权值的情况下，rnk 出来的是最大 rnk，kth 就是 kth。

于是我们成功把 set 改成了常数十分小的权值树状数组。这样 \(O(n \sqrt n \log n)\) 就可以在 4s 内卡过啦！（确信）

方法 2：

我们考虑把不删除改成不加入。（回滚莫队不仅能做不删除，也可以做不加入，具体方法就考虑某一块先计算 \(head \sim n\) 的答案，然后移动两边的指针）

这样做有什么好处呢？我们删除的时候直接用链表删除即可。（之前小瞧了这个数据结构，但是确实很有用）这样不用维护一棵平衡树，是 \(O(1)\) 的。考虑每一块插入过程。可以对 \(O(n)\) 长度的数组直接排序。暴力插入还是带一个 \(\log\)，但是我们可以从右往左进行。这样做，这部分复杂度直接变成 \(O(n \log n)\)，那么整体复杂度就是纯根号的。

方法 3：

考虑虚树的另一种形式：虚树根到原树根的一条链加上原树根到点集中所有点的并。

首先链是好求的，就一个区间 lca，这里不说了。重点是并怎么算。注意到这里就转化为了到根的链上问题了。如果不知道接下来干什么，接着想。

考虑扫描线的第二种形式，扫 \(r\)，维护所有 \(l\) 的答案。考虑二维数点那个做法，维护最后一次出现位置。可以启发到这题上。注意到一个 \(r\) 是给 \(r\) 到 \(1\) 的链上这些点全部加入一次虚树，那么我们考虑维护时间戳，也就是每一个点是什么时候加入的虚树。

发现这个全部加入类似颜色段均摊处理的东西，考虑树剖之后是 \(\log\) 段连续段，这意味着每次扫描线右端点动了的时候只会插入 \(\log\) 段区间，所以这部分的时间复杂度是 \(O(\log^2 )\) 的。

考虑查询怎么做。额外维护一个权值树状数组拿来查询 rank。只需要实时维护颜色为某一个数的区间总大小即可。查询部分的时间复杂度是 \(O(\log)\) 的。

分几步：

树剖预处理。
扫描线，预先把所有区间打到 \(r\) 上。每次 \(r\) 动的时候，沿着 \(1 \sim c_r\) 的链走，更新颜色段，并在树状数组里更新。
处理查询，在树状数组里查询即可。树状数组支持 rank。

总时间复杂度 \(O(n + n \log^2 n + q \log n)\)。

三维莫队

给定 \((i_n, j_n, k_n)\) 数组，长度为 \(n\)，值域 \([1, n]\)，数据随机，求一组排列，使得下式比较小：

\[\sum \limits_{T = 2}^{n} |i_T - i_{T-1}| + |j_T - j_{T-1}| + |k_T - k_{T-1}| \]

考虑对 \(x, y\) 两个维度分块，令 \(z\) 递增。由于数据随机，可以认为是均匀的。

考虑块长为 \(S\)，那么块数 \(O(\cfrac{n^2}{S^2})\)。\(z\) 端点移动距离 \(O(\cfrac{n^2}{S^2} \times n)\)，\(x,y\) 端点移动距离 \(O(nS)\)。令其根号平衡可得 \(S = n^{\frac{2}{3}}\)，算出来答案 \(O(n^{\frac{5}{3}})\)。

posted @ 2023-03-22 21:19 OIer某罗阅读(38) 评论(0) 编辑收藏举报

刷新页面返回顶部

Zeardoe

莫队

算法介绍

树上莫队

回滚莫队

joisc 2023 Day 3 C

三维莫队

公告