线段树合并 总结
今天学习了一下动态开点的线段树以及线段树合并吧
理解应该还是比较好理解的,动态开点的话可以避免许多空间的浪费,因为这类问题我们一般建立的是权值线段树,而权值一般范围比较大,直接像原来那样开四倍空间的话空间复杂度不能承受。
动态开点的代码如下:
void insert(int &i, int l, int r, int x) { i = ++T; if(l == r) { sum[i]++; return ; } int mid = (l + r) >> 1; if(x <= mid) insert(lc[i], l, mid, x) ; if(x > mid) insert(rc[i], mid + 1, r, x) ; update(i); }
因为对应位置的结点所代表的区间范围都是一样的,只是保存的信息有所不同,如果信息具有可加性,或者说区间信息可以合并的话,那么就可以两棵树同时往根节点开始同时往下递归遍历树:如果其中一个结点为空,那么我们就返回另外一个结点;否则,选一个结点作为合并之后的点,用另一个点来更新信息即可。最后自底向上维护我们需要的信息就好了。
合并代码如下:
int merge(int x, int y) { if(!x) return y; if(!y) return x; sum[x] += sum[y] ;//合并区间信息 lc[x] = merge(lc[x], lc[y]) ; rc[x] = merge(rc[x], rc[y]) ; return x;//相当于删除另外一个结点 }
假设我们以$n$个点为根建立权值线段树,由于我们是动态开点,每颗线段树最后都是一条链,那么空间复杂度和时间复杂度都是$O(nlogn)$的。最后我们合并的时候,每次merge操作都会减少一个点,所以最后总的合并过程时间复杂度为$O(nlogn)$,也是十分优秀的了。
接下来看几道例题吧~
1.洛谷P3605
题意:
给出一颗树,每个点都有一个权值,最后对于每个点,输出在它的子树中,有多少个点的权值比它大。
题解:
这是一个比较裸的题,由于权值数量关系是可以合并的,我们对于每一个点建立一颗权值线段树。之后从1号结点开始dfs,在回溯的过程中不断合并就行了。
对于每个点,查询一下目前的线段树中有多少权值比它大的就可以了。
详见代码:
#include <bits/stdc++.h> using namespace std; typedef long long ll; const int N = 1e5 + 5; int p[N], a[N], ans[N] ; int tre[N * 20], lc[N * 20], rc[N * 20], rt[N]; int n, T; struct Edge{ int v, next ; }e[N]; int head[N], tot ; void adde(int u, int v) { e[tot].v = v; e[tot].next = head[u]; head[u] = tot++; } void insert(int &i, int l, int r, int x) { if(r < l) return ; i = ++T; if(l == r) { tre[i]++ ; return ; } int mid = (l + r) >> 1 ; if(x <= mid) insert(lc[i], l, mid, x) ; if(x > mid) insert(rc[i], mid + 1, r, x) ; tre[i] = tre[lc[i]] + tre[rc[i]] ; } int query(int root, int l, int r, int x) { if(!root) return 0; if(l >= x) return tre[root]; int ans = 0; int mid = (l + r) >> 1; if(mid >= x) ans += query(lc[root], l, mid, x) ; ans += query(rc[root], mid + 1, r, x) ; return ans ; } int merge(int x, int y) { if(!x) return y; if(!y) return x; lc[x] = merge(lc[x], lc[y]) ; rc[x] = merge(rc[x], rc[y]) ; tre[x] = tre[lc[x]] + tre[rc[x]] ; return x; } void dfs(int u) { for(int i = head[u]; i != -1; i = e[i].next) { int v = e[i].v ; dfs(v) ; rt[u] = merge(rt[u], rt[v]) ; } ans[u] = query(rt[u], 1, n, a[u] + 1) ; } int main() { ios::sync_with_stdio(false); cin.tie(0); cin >> n; for(int i = 1; i <= n; i++) cin >> p[i] , a[i] = p[i]; sort(p + 1, p + n + 1); int D = unique(p + 1, p + n + 1) - p - 1; for(int i = 1; i <= n; i++) a[i] = lower_bound(p + 1, p + D + 1, a[i]) - p; memset(head, -1, sizeof(head)) ; for(int i = 2; i <= n; i++) { int x;cin >> x; adde(x, i) ; } for(int i = 1; i <= n; i++) insert(rt[i], 1, n, a[i]) ; dfs(1) ; for(int i = 1; i <= n; i++) cout << ans[i] << '\n'; return 0; }
由于本题中子树的信息也具有可加性。这个题还可以用树状数组来做,记录一下进点的$tot1$,遍历完整颗子树后,查询现在的$tot2$,这里的$tot1$,$tot2$都为比当前结点权值大的个数,然后$tot2-tot1$即为答案。
代码如下:
#include <bits/stdc++.h> using namespace std; typedef long long ll; const int N = 1e5 + 5; int p[N], a[N], ans[N] ; int c[N]; int n, T; struct Edge{ int v, next ; }e[N]; int head[N], tot ; void adde(int u, int v) { e[tot].v = v; e[tot].next = head[u]; head[u] = tot++; } int lowbit(int x) { return x & (-x) ; } void update(int p, int v) { for(int i = p ; i < N; i += lowbit(i)) c[i] += v ; } int query(int p) { int ans = 0 ; for(int i = p ; i > 0 ; i -= lowbit(i)) ans += c[i] ; return ans ; } void dfs(int u) { update(a[u], 1); int sum1 = query(N - 1) - query(a[u]) ; for(int i = head[u]; i != -1; i = e[i].next) { int v = e[i].v; dfs(v) ; } int sum2 = query(N - 1) - query(a[u]) ; ans[u] = sum2 - sum1 ; } int main() { ios::sync_with_stdio(false); cin.tie(0); cin >> n; for(int i = 1; i <= n; i++) cin >> p[i] , a[i] = p[i]; sort(p + 1, p + n + 1); int D = unique(p + 1, p + n + 1) - p - 1; for(int i = 1; i <= n; i++) a[i] = lower_bound(p + 1, p + D + 1, a[i]) - p; memset(head, -1, sizeof(head)) ; for(int i = 2; i <= n; i++) { int x;cin >> x; adde(x, i) ; } dfs(1) ; for(int i = 1; i <= n; i++) cout << ans[i] << '\n'; return 0; }
2.洛谷P3224
题意:
一开始给出$n$个点,$m$条边,每个点都有其权值,然后会不断地加边,中途可能会有询问,格式为"$v$ $k$",意义为当前与$v$连通的所有点中,权值第$k$小的岛是哪座岛。
题解:
涉及到连通性,我们考虑用并查集来处理。具体做法为对于每个连通块建立一颗权值线段树来维护信息,然后对于加边过程,就不断合并两点所在集合的线段树就行了。
对于询问,直接在对应线段树中询问当前点所在集合第k小就行。
代码如下:
#include <bits/stdc++.h> using namespace std; typedef long long ll; const int N = 100005; int n, m; int v[N], f[N], rt[N], lc[N * 20], rc[N * 20], sum[N * 20], rk[N *20]; int T ; int find(int x) { return f[x] == x ? f[x] : f[x] = find(f[x]) ; } void insert(int &i, int l, int r, int x) { if(r < l) return ; i = ++T; if(l == r) { sum[i]++; return ; } int mid = (l + r) >> 1; if(x <= mid) insert(lc[i], l, mid, x) ; if(x > mid) insert(rc[i], mid + 1, r, x) ; sum[i] = sum[lc[i]] + sum[rc[i]] ; } int merge(int x, int y, int l, int r) { if(!x) return y; if(!y) return x; if(l == r) { sum[x] += sum[y] ; return x; } int mid = (l + r) >> 1; lc[x] = merge(lc[x], lc[y], l, mid) ; rc[x] = merge(rc[x], rc[y], mid + 1, r) ; sum[x] = sum[lc[x]] + sum[rc[x]] ; return x; } int query(int root, int l, int r, int k) { if(l == r) return l ; int mid = (l + r) >> 1; if(sum[lc[root]] >= k) return query(lc[root], l, mid, k) ; else return query(rc[root], mid + 1 ,r ,k - sum[lc[root]]) ; } int main() { scanf("%d%d",&n, &m) ; for(int i = 1; i <= n; i++) scanf("%d", &v[i]), rk[v[i]] = i; for(int i = 1; i <= n; i++) f[i] = i; for(int i = 1; i <= n; i++) insert(rt[i], 1, n, v[i]) ; for(int i = 1; i <= m; i++) { int u, v; scanf("%d%d",&u, &v); int fx = find(u), fy = find(v) ; if(fx != fy) { rt[fx] = merge(rt[fx], rt[fy], 1, n) ; f[fy] = fx; } } int q ; scanf("%d", &q) ; char s[2] ; while(q--) { int u, v; scanf("%s%d%d",s, &u, &v); if(s[0] == 'Q') { int fx = find(u); if(sum[rt[fx]] < v) { printf("-1\n"); continue ; } int ans = query(rt[fx], 1, n, v) ; printf("%d\n", rk[ans]); }else { int fx = find(u), fy = find(v) ; if(fx != fy) { rt[fx] = merge(rt[fx], rt[fy], 1, n) ; f[fy] = fx; } } } return 0; }
3.洛谷P3521
题意:
给一棵n(1≤n≤200000个叶子的二叉树,可以交换每个点的左右子树,要求前序遍历叶子的逆序对最少。
题解:
假设当前点的左右儿子分别为$ls$,$rs$,很容易发现,交换以这两个结点为根节点的子树,并不会影响他们的祖宗交换时逆序对的个数。所以我们可以考虑每一层贪心地进行交换,此时局部最优即全局最优。
同时,对于区间$\left[L,R\right]$,设其中点为$mid$,我们只需要考虑这样的逆序对$\left(x,y\right)$,满足$L\leq x\leq mid$,$mid+1\leq y\leq R$即可,并不需要考虑在同一个子树中的逆序对数量。
由于这是权值线段树,那么逆序对其实很好统计,对于两颗线段树代表同一段区间的两个节点,考虑交换与不交换两种情况,分别取左、右部分或者右、左部分统计逆序对个数。最后取最小值就可以了。
详细见代码:
#include <bits/stdc++.h> using namespace std; typedef long long ll; const int N = 2e5 + 5; int n ; ll sum[N * 22] ; int lc[N * 22], rc[N * 22], rt[N * 22]; int T; ll ans, sum1, sum2; int merge(int x, int y) { if(!x) return y; if(!y) return x; sum[x] += sum[y] ; sum1 += sum[lc[x]] * sum[rc[y]] ; sum2 += sum[rc[x]] * sum[lc[y]] ; lc[x] = merge(lc[x], lc[y]) ; rc[x] = merge(rc[x], rc[y]) ; return x; } void insert(int &i, int l, int r, int x) { i = ++T; if(l == r) { sum[i]++; return ; } int mid = (l + r) >> 1; if(x <= mid) insert(lc[i], l, mid, x) ; if(x > mid) insert(rc[i], mid + 1, r, x) ; sum[i] = sum[lc[i]] + sum[rc[i]] ; } void dfs(int &p) { int x, ls, rs;p = 0; cin >> x ; if(x == 0) { dfs(ls); dfs(rs); sum1 = sum2 = 0; p = ls ; p = merge(ls, rs) ; ans += min(sum1, sum2) ; } else insert(rt[x], 1, n, x), p = rt[x]; } int main() { ios::sync_with_stdio(false); cin.tie(0); cin >> n; int t = 0; dfs(t); cout << ans ; return 0 ; }
重要的是自信,一旦有了自信,人就会赢得一切。