树上前缀和与差分
树上前缀和
设 \(sum_i\) 表示根节点到节点 \(i\) 的权值总和。
则有:
- 对于点权,\(x,y\) 路径上的和为 \(sum_x + sum_y - sum_{lca} - sum_{fa_{lca}}\)。
- 对于边权,\(x,y\) 路径上的和为 \(sum_x + sum_y - 2 \times sum_{lca}\)。
习题:P4427 [BJOI2018] 求和
解题思路
预处理出 \(sum_{i,k}\) 表示根节点到节点 \(i\) 的深度的 \(k\) 次方和,这个过程的时间复杂度为 \(O(nk)\),后面即为树上点权前缀和问题。
参考代码
#include <cstdio>
#include <vector>
#include <algorithm>
using std::swap;
using std::vector;
const int N = 3e5 + 5;
const int K = 55;
const int LOG = 19;
const int MOD = 998244353;
vector<int> tree[N];
int fa[N][LOG], depth[N], sum[N][K];
void dfs(int u, int pre) {
depth[u] = depth[pre] + 1;
int d = 1;
for (int i = 0; i < K; i++) {
sum[u][i] = (sum[pre][i] + d) % MOD;
d = 1ll * d * depth[u] % MOD;
}
fa[u][0] = pre;
for (int v : tree[u]) {
if (v == pre) continue;
dfs(v, u);
}
}
int lca(int x, int y) {
if (depth[x] < depth[y]) swap(x, y);
int delta = depth[x] - depth[y];
for (int i = LOG - 1; i >= 0; i--)
if (delta & (1 << i)) x = fa[x][i];
if (x == y) return x;
for (int i = LOG - 1; i >= 0; i--) {
if (fa[x][i] != fa[y][i]) {
x = fa[x][i]; y = fa[y][i];
}
}
return fa[x][0];
}
int main()
{
int n; scanf("%d", &n);
for (int i = 1; i < n; i++) {
int x, y; scanf("%d%d", &x, &y);
tree[x].push_back(y);
tree[y].push_back(x);
}
depth[0] = -1;
dfs(1, 0);
for (int i = 1; i < LOG; i++) {
for (int j = 1; j <= n; j++) fa[j][i] = fa[fa[j][i - 1]][i - 1];
}
int m; scanf("%d", &m);
while (m--) {
int i, j, k; scanf("%d%d%d", &i, &j, &k);
int lca_ij = lca(i, j), f = fa[lca_ij][0];
int ans1 = (sum[i][k] + MOD - sum[f][k]) % MOD;
int ans2 = (sum[j][k] + MOD - sum[lca_ij][k]) % MOD;
printf("%d\n", (ans1 + ans2) % MOD);
}
return 0;
}
树上差分
树上差分可以理解为对树上的某一段路径进行差分操作,这里的路径可以类比一维数组的区间进行理解。例如在对树上的一些路径进行频繁操作,并且询问某条边或者某个点在经过操作后的值的时候,就可以运用树上差分思想。
点差分
例题:P3128 [USACO15DEC] Max Flow P
问题描述:有 \(n\) 个节点,用 \(n-1\) 条边连接,所有节点都连通。给出 \(k\) 条路径,第 \(i\) 条路径为节点 \(s_i\) 到 \(t_i\)。每给出一条路径,路径上所有节点的权值加 \(1\)。输出最大权值点的权值。
数据范围:\(2 \le n \le 50000, 1 \le k \le 100000\)
树上两点 \(u,v\) 的路径指的是最短路径。可以把 \(u \rightarrow v\) 的路径分为两个部分:\(u \rightarrow LCA(u,v)\) 和 \(LCA(u,v) \rightarrow v\)。
先考虑简单的思路。首先对每条路径求 LCA,分别以 \(u\) 和 \(v\) 为起点到 LCA,把路径上每个节点的权值加 \(1\);然后对所有路径进行类似操作。把路径上每个节点加 \(1\) 的操作的复杂度为 \(O(n)\),共 \(k\) 次操作,会超时。
本题的关键是如何记录路径上每个节点的修改。显然,如果真的对每个节点都记录修改,肯定会超时。我们可以利用差分,因为差分的用途是“把区间问题转换为断电问题”,适用这种情况。
给定数组 \(a\),定义差分数组 \(D[k]=a[k]-a[k-1]\),即数组相邻元素的差。
从差分数组的定义可以推出:\(a[k]=D[1]+D[2]+ \cdots + D[k] = \sum\limits_{i=1}^{k} D[i]\)
这个式子描述了 \(a\) 和 \(D\) 的关系,即“差分是前缀和的逆运算” ,它把求 \(a[k]\) 转换为求 \(D\) 的前缀和。
对于区间 \([L,R]\) 的修改问题,比如把区间内每个元素都加上 \(d\),则可以对区间的两个端点 \(L\) 和 \(R+1\) 做以下操作:
- 把 \(D[L]\) 加上 \(d\);
- 把 \(D[R+1]\) 减去 \(d\)。
对 \(D\) 求前缀和,则可得到 \(a\) 数组,以上的更新相当于:
- \(1 \le x < L\),\(a[x]\) 不变;
- \(L \le x \le R\),\(a[x]\) 增加了 \(d\);
- \(R < x \le N\),\(a[x]\) 不变,因为被 \(D[R+1]\) 中减去的 \(d\) 抵消了。
利用差分能够把区间修改问题转换为只用端点做记录。如果不用差分数组,区间内每个元素都需要修改,时间复杂度为 \(O(n)\);转换为只修改两个端点后,时间复杂度降到 \(O(1)\),这就是差分的重要作用。
把差分思想用到树上,只需要把树上路径转换为区间即可。把一条路径 \(u \rightarrow v\) 分为两部分:\(u \rightarrow LCA(u,v)\) 和 \(LCA(u,v) \rightarrow v\),这样每条路径都可以当成一个区间处理。
记 \(LCA(u,v)=R\),并记 \(R\) 的父节点为 \(F=fa[R]\),要把路径上每个节点权值加 \(1\),有:
- 路径 \(u \rightarrow R\) 这个区间上,\(D[u]++\),\(D[F]--\);
- 路径 \(v \rightarrow R\) 这个区间上,\(D[v]++\),\(D[F]--\)。
经过以上操作,能通过 \(D\) 计算出 \(u \rightarrow v\) 上每个节点的权值。不过,由于两条路径在 \(R\) 和 \(F\) 这里重合了,这两个步骤把 \(D[R]\) 加了两次,把 \(D[F]\) 减了两次,需要调整为 \(D[R]--\) 和 \(D[F]--\)。
在本题中,对每条路径都用倍增法求一次 LCA,并做一次差分操作。当对于所有路径都操作完成后,再做一次 DFS,求出每个节点的权值,所有权值中的最大值即为答案。
\(k\) 次 LCA 的时间复杂度为 \(O(n \log n + k \log n)\);最后做一次 DFS,时间复杂度为 \(O(n)\);总的时间复杂度为 \(O((n+k) \log n)\)。
参考代码
#include <cstdio>
#include <vector>
#include <algorithm>
using namespace std;
const int N = 50005;
const int LOG = 16;
vector<int> tree[N];
int d[N], fa[N][LOG], a[N], ans;
void dfs(int cur, int pre) {
d[cur] = d[pre] + 1;
fa[cur][0] = pre;
for (int i = 1; i < LOG; i++) fa[cur][i] = fa[fa[cur][i - 1]][i - 1];
for (int nxt : tree[cur])
if (nxt != pre) dfs(nxt, cur);
}
int lca(int x, int y) {
if (d[x] < d[y]) swap(x, y);
int len = d[x] - d[y];
for (int i = LOG - 1; i >= 0; i--)
if (1 << i <= len) {
x = fa[x][i]; len -= 1 << i;
}
if (x == y) return x;
for (int i = LOG - 1; i >= 0; i--)
if (fa[x][i] != fa[y][i]) {
x = fa[x][i]; y = fa[y][i];
}
return fa[x][0];
}
void calc(int cur, int pre) {
for (int nxt : tree[cur])
if (nxt != pre) {
calc(nxt, cur);
a[cur] += a[nxt];
}
ans = max(ans, a[cur]);
}
int main()
{
int n, k;
scanf("%d%d", &n, &k);
for (int i = 1; i < n; i++) {
int x, y;
scanf("%d%d", &x, &y);
tree[x].push_back(y); tree[y].push_back(x);
}
dfs(1, 0); // 计算每个节点的深度并预处理fa数组
while (k--) {
int s, t;
scanf("%d%d", &s, &t);
int r = lca(s, t);
a[s]++; a[t]++; a[r]--; a[fa[r][0]]--; // 树上差分
}
calc(1, 0); // 用差分数组求每个节点的权值
printf("%d\n", ans);
return 0;
}
边差分
例题:P6869 [COCI2019-2020#5] Putovanje
显然针对每一条边只会考虑购买单程票和多程票的一种,这取决于该条边被经过的次数 \(k\),这样一来这条边上的最少花费是 \(\min (k c_1, c_2)\)。
这里需要根据若干条路径计算出每条边经过的次数,可以借助差分思想,注意它和点差分不同。对于边相关的问题,一般我们会将每个点与它父亲节点相连的边与该点绑定,从而将边上信息的维护转化为对点的信息的维护。
参考代码
#include <cstdio>
#include <vector>
#include <algorithm>
using namespace std;
typedef long long LL;
const int N = 200005;
const int LOG = 19;
vector<int> tree[N];
int d[N], fa[N][LOG], cnt[N], a[N], b[N], c1[N], c2[N];
void dfs(int cur, int pre) {
d[cur] = d[pre] + 1;
fa[cur][0] = pre;
for (int i = 1; i < LOG; i++) fa[cur][i] = fa[fa[cur][i - 1]][i - 1];
for (int nxt : tree[cur])
if (nxt != pre) dfs(nxt, cur);
}
int lca(int x, int y) {
if (d[x] < d[y]) swap(x, y);
int len = d[x] - d[y];
for (int i = LOG - 1; i >= 0; i--)
if ((1 << i) <= len) {
x = fa[x][i]; len -= 1 << i;
}
if (x == y) return x;
for (int i = LOG - 1; i >= 0; i--)
if (fa[x][i] != fa[y][i]) {
x = fa[x][i]; y = fa[y][i];
}
return fa[x][0];
}
void calc(int cur, int pre) {
for (int nxt : tree[cur])
if (nxt != pre) {
calc(nxt, cur);
cnt[cur] += cnt[nxt];
}
}
int main()
{
int n;
scanf("%d", &n);
for (int i = 1; i < n; i++) {
scanf("%d%d%d%d", &a[i], &b[i], &c1[i], &c2[i]);
tree[a[i]].push_back(b[i]);
tree[b[i]].push_back(a[i]);
}
dfs(1, 0);
for (int i = 1; i < n; i++) {
int r = lca(i, i + 1);
cnt[i]++; cnt[i + 1]++; cnt[r] -= 2;
}
calc(1, 0);
LL ans = 0;
for (int i = 1; i < n; i++) {
if (d[a[i]] > d[b[i]]) ans += min(1ll * c1[i] * cnt[a[i]], 1ll * c2[i]);
else ans += min(1ll * c1[i] * cnt[b[i]], 1ll * c2[i]);
}
printf("%lld\n", ans);
return 0;
}