树的直径
树的直径是指树上最远的两点间的距离,又称为树的最远点对。有两种方法求树的直径,时间复杂度都为 \(O(n)\):
- 做两次 DFS(或 BFS)
- 树形 DP
两种方法有各自的优点和缺点。
做两次 DFS(或 BFS)方法的优点是能得到完整的路径。因为它用搜索的原理,从起点 \(u\) 出发一步一步求 \(u\) 到其他所有点的距离,能记录路径经过了哪些点。缺点是不能用于有负权边的树。
树形 DP 方法的优点是允许树上有负权边。缺点是只能求直径的长度,无法得到这条直径的完整路径。
例题:PT07Z - Longest path in a tree
做两次 DFS(或 BFS)
当边权没有负值时,计算树的直径可以通过做两次搜索遍历解决,步骤如下:
- 从树上的任意点 \(r\) 出发,求距离它最远的点 \(s\),则 \(s\) 肯定是直径的两个端点之一。
- 从 \(s\) 出发,求距离 \(s\) 最远的点 \(t\),则 \(t\) 是直径的另一个端点。
因此 \(s\) 和 \(t\) 就是距离最远的两个点,即树的直径的两个端点。
证明
使用反证法,假设 \(x\) 到 \(y\) 才是真正的直径,而第一次遍历找到的距离 \(r\) 最远的点 \(s\) 不为 \(x\) 或 \(y\)。
这个例子说明,以贪心原理进行路径长度搜索,当树上有负权边时,只能获得局部最优,而无法获得全局最优,这与图论中的 Dijkstra 算法不能用于负权边是同样的道理。
#include <cstdio>
#include <vector>
using namespace std;
const int N = 10005;
vector<int> tree[N];
int dis[N]; // 记录距离
void dfs(int u, int fa) {
for (int v : tree[u]) {
if (v == fa) continue;
dis[v] = dis[u] + 1;
dfs(v, u);
}
}
int main()
{
int n;
scanf("%d", &n);
for (int i = 1; i < n; i++) {
int u, v;
scanf("%d%d", &u, &v);
tree[u].push_back(v); tree[v].push_back(u);
}
dfs(1, 0); // 任选一个起点(如1)计算到树上每个节点的距离
int s = 0;
for (int i = 1; i <= n; i++)
if (dis[i] > dis[s]) s = i; // 找最远的点s,s是直径的一个端点
dis[s] = 0;
dfs(s, 0); // 从s出发,计算以s为起点,到树上每个节点的距离
int ans = 0;
for (int i = 1; i <= n; i++) ans = max(ans, dis[i]);
printf("%d\n", ans);
return 0;
}
树形 DP
定义状态 \(dp_u\) 表示以 \(u\) 为根节点的子树上,从 \(u\) 出发能到达的最远路径长度,这个路径的终点是 \(u\) 的一个叶子节点。
状态转移:\(dp_u = \max \{ dp_{v} + edge(u,v) \}, \ v \in son_u\)
整棵树的直径怎么求?设 \(f_u\) 代表经过点 \(u\) 的最长路径长度,显然,在所有的 \(f_u\) 中,最大值就是树的直径长度。
如何计算 \(f_u\) ?实际上在 \(dp_u\) 的计算过程中相当于尝试每一棵子树的贡献,而经过 \(u\) 的最长路径实际上可以用最优的两棵子树合并得到,因此只需在枚举子节点计算 \(dp_u\) 时记录最大值和次大值,最大值加次大值即为 \(f_u\) 的结果。
#include <cstdio>
#include <vector>
using namespace std;
const int N = 10005;
vector<int> tree[N];
int dp[N], ans;
void dfs(int u, int fa) {
int max1 = 0, max2 = 0;
for (int v : tree[u]) {
if (v == fa) continue;
dfs(v, u);
if (dp[v] + 1 > max1) {
max2 = max1;
max1 = dp[v] + 1;
} else if (dp[v] + 1 > max2) {
max2 = dp[v] + 1;
}
}
dp[u] = max1;
ans = max(ans, max1 + max2);
}
int main()
{
int n;
scanf("%d", &n);
for (int i = 1; i < n; i++) {
int u, v;
scanf("%d%d", &u, &v);
tree[u].push_back(v); tree[v].push_back(u);
}
dfs(1, 0);
printf("%d\n", ans);
return 0;
}
习题:P3174 [HAOI2009] 毛毛虫
解题思路
本题要求的最大“毛毛虫”实际上是在树的直径的基础上多了一些“脚”,可以借用求直径的思路。
定义状态 \(dp_u\) 表示以 \(u\) 为根节点的子树上,\(u\) 到某个叶子节点形成的最大“身体+脚”的个数,则有状态转移:\(dp_u = \max \{ dp_v + 1 \} + feet\),这里的 \(feet\) 代表“脚”的数量,当 \(u\) 没有子树时,就没有额外的“脚”,有子树时,除了作为主干身体的那一枝以外,其他的子树可以留一个点做“脚”。
类似求直径的方法,此时经过点 \(u\) 的最大“毛毛虫”可以基于计算 \(dp_u\) 过程中最大和次大的两次计算来提供毛毛虫的“身体”,则 \(u\) 的其他邻居节点可以提供“脚”。注意这里计算的“脚”的数量要考虑 \(u\) 的父节点。
参考代码
#include <cstdio>
#include <vector>
#include <algorithm>
using namespace std;
const int N = 300005;
vector<int> tree[N];
int dp[N], ans;
void dfs(int u, int fa) {
int child = 0;
int max1 = 0, max2 = 0;
for (int v : tree[u]) {
if (v == fa) continue;
child++;
dfs(v, u);
if (dp[v] > max1) {
max2 = max1; max1 = dp[v];
} else if (dp[v] > max2) {
max2 = dp[v];
}
}
dp[u] = max1 + 1 + max(child - 1, 0);
ans = max(ans, max1 + max2 + 1 + max(child - 2, 0) + (fa != 0));
}
int main()
{
int n, m; scanf("%d%d", &n, &m);
while (m--) {
int a, b; scanf("%d%d", &a, &b);
tree[a].push_back(b); tree[b].push_back(a);
}
dfs(1, 0);
printf("%d\n", ans);
return 0;
}