动态 DP 学习笔记

似乎 NOIP2019D2T3 把这个东西宣传的很到位啊。

~~我才不会告诉你我已经学过一遍了~~ 早就忘了。

以 bzoj4712 洪水为例。

首先我们有一个暴力 DP 的式子。

令 $dp[x]$ 表示以 $x$为根的子树的最小代价，$v[x]$ 表示每个点的权值。

于是转移就是：

\[dp[x] = \min(v[x], \sum_{y\in child_x} dp[y]) \]

不用动态 DP 的做法

实际上这道题有一个不用动态 DP 的做法。

不想看的可以直接跳过。

[戳我跳过](#动态 DP)

因为保证了所有的 $to$ 都是非负数，那么也就是说，所有的 $v[x]$ 都是只增不减的，那么也就意味着，所有的 $dp[x]$ 也是只增不减的。

那么，每个点之多发生一次 $\sum\limits_{y\in child_x} dp[y]$ 由 $\leq v[x]$ 变成 $> v[x]$（被修改的那个点除外）。

于是这种情况也是最多发生 $n+m$ 次的。加上 $m$ 是因为每一次修改会有可能破坏一次。

所以如果我们可以得到一种很好的想法：找到所有的 $\sum\limits_{y\in child_x} dp[y]$ 与 $v[x]$ 的大小关系发生改变的点，然后暴力修改。

可以发现，从被修改的点的 $dp$ 值被增加的量开始，其所有的祖先，最下面会有一段和这个增量相同。直到某一个点的 $\sum\limits_{y\in child_x} dp[y]$ 与 $v[x]$ 的大小关系发生改变，或者到 $\sum\limits_{y\in child_x} dp[y] \geq v[x]$ 停止。所以我们要做的就是通过数据结构维护最近的一次 $\sum\limits_{y\in child_x} dp[y]$ 与 $v[x]$ 的大小关系发生改变的情况。

可以直接维护每个点的 $v[x] - \sum\limits_{y\in child_x} dp[y]$ 的结果，然后进行树链剖分，在重链上可以直接进行线段树二分找出这样的点。

于是整个题目可以在总 $O((n+m)\log^2 n)$ 的复杂度完成。

问题

某毒瘤：“听说你可以用均摊分析的方法过掉？”

然后轻轻的敲下了 vim problem.tex，然后找到 n<=200000，保证任意to都为非负数 这一行，将光标停在了那个逗号上，优雅地按下了可怕的 d$，那句“保证任意to都为非负数”瞬间消失得无影无踪。

动态 DP

如上文所述，如果不能保证 $to$ 为非负数，那么我们之前的均摊分析就不成立，复杂度就直接炸没影了。

我们考虑使用一种叫作动态 DP 的科技来解决这个问题。

我们回顾一下上面的 DP 式子：

\[dp[x] = \min(v[x], \sum_{y\in child_x} dp[y]) \]

如果我们把这棵树进行树链剖分的话，我们先定义一些方便的符号：$child_x$ 表示 $x$ 的所有孩子的集合；$son_x$ 表示 $x$ 的重儿子（这个名字怎么充满的封建的味道），$light_x$ 表示 $x$ 的轻儿子集合。

那么，如果我们令 $h[x]$ 表示 $x$ 的所有轻儿子的 $dp$ 值之和，即 $h[x] = \sum\limits_{y\in light_x} dp[y]$。则原式可以改写为：

\[dp[x] = \min(v[x], h[x]+dp[son_x]) \]

类似于一般的递推，我们考虑用一种新式的矩阵来表示这种关系：

对于两个矩阵 $A$ 和 $B$，定义一种新的乘法运算，令 $C = A\times B$，则

\[C_{i, j} = \min_{k=1}^n A_{i, k} + B_{k, j} \]

那么，我们上面的运算可以被用矩阵乘法的形式表示为：

\[\begin{bmatrix}h[x] & v[x] \\ 0 & 0\end{bmatrix} \times \begin{bmatrix}dp[son_x] \\ 0\end{bmatrix} = \begin{bmatrix}dp[x] \\ 0\end{bmatrix} \]

类似于矩阵快速幂，我们来证明一下我们定义的这一种矩乘具有结合律。

对于矩阵大小为 $a \times b$ 的矩阵 $A$，大小为 $b \times c$ 的矩阵 $B$，大小为 $c\times d$ 的矩阵 $C$，求证：$(A\times B)\times C = A \times (B \times C)$。

证明：

令 $E = A\times B$，$F = B \times C$。

则

\[E_{i, j} = \min_{k=1}^b A_{i, k} + B_{k, j}\\ F_{i, j} = \min_{k=1}^c B_{i, k} + C_{k, j} \]
然后

\[E\times C = \min_{l=1}^c\{\min_{k=1}^b A_{i, k} + B_{k, l} + C_{l,j}\}\\ \begin{align*} A\times F &= \min_{l=1}^b\{A_{i,l} + \min_{k=1}^c B_{i, k} + C_{k, j}\}\\ &= \min_{k=1}^c\{\min_{l=1}^b A_{i, l} + B_{i, k} + C_{k, j}\}\\ &= \min_{l=1}^c\{\min_{k=1}^b A_{i, k} + B_{i, l} + C_{l, j}\}\\ \end{align*} \]
容易发现 $E\times C = A \times F$，即 $(A\times B) \times C = A \times (B \times C)$。

令 $V_x = \begin{bmatrix}h[x]&v[x]\\0&0 \end{bmatrix}$。

我们可以发现，如果我们把一条重链上面的点的 $V$ 矩阵从某一个点 $x$ 开始，按照深度从上到下的顺序乘在一起，最后再乘上一个 $\begin{bmatrix}0\\0\end{bmatrix}$，那么我们就可以得到重链顶端的 $x$ 的 $dp$ 值了。

上面就是查询的方法了。

下面我们考虑修改应该怎么做。

修改会影响到的 $dp$ 值是从根到 $x$ 的所有点的。——但是我们实际上不需要考虑所有的 $dp$ 值，因为 $dp$ 值本身没有被存储下来。需要考虑的是影响到了哪些 $h[x]$。

每一个点的重儿子的 $dp$ 值不影响 $h[x]$ 值，被影响的只有每一条重链之间的那一个轻边。所以直接在树剖向上跳的时候用新的 $dp$ 值更新一下就好了。

然后这样的时间复杂度就是一个树链剖分的复杂度 $O(q\log^2n)$。

代码如下：

#include<bits/stdc++.h>

#define fec(i, x, y) (int i = head[x], y = g[i].to; i; i = g[i].ne, y = g[i].to)
#define dbg(...) fprintf(stderr, __VA_ARGS__)
#define File(x) freopen(#x".in", "r", stdin), freopen(#x".out", "w", stdout)
#define fi first
#define se second
#define pb push_back

template<typename A, typename B> inline char smax(A &a, const B &b) {return a < b ? a = b, 1 : 0;}
template<typename A, typename B> inline char smin(A &a, const B &b) {return b < a ? a = b, 1 : 0;}

typedef long long ll; typedef unsigned long long ull; typedef std::pair<int, int> pii;

template<typename I> inline void read(I &x) {
	int f = 0, c;
	while (!isdigit(c = getchar())) c == '-' ? f = 1 : 0;
	x = c & 15;
	while (isdigit(c = getchar())) x = (x << 1) + (x << 3) + (c & 15);
	f ? x = -x : 0;
}

#define lc o << 1
#define rc o << 1 | 1

const int N = 200000 + 7;
const ll INF = 0x3f3f3f3f3f3f3f3f;

int n, m, dfc;
int a[N];
int dep[N], f[N], siz[N], son[N], dfn[N], pre[N], top[N], bot[N];
ll dp[N], h[N];

struct Edge { int to, ne; } g[N << 1]; int head[N], tot;
inline void addedge(int x, int y) { g[++tot].to = y, g[tot].ne = head[x], head[x] = tot; }
inline void adde(int x, int y) { addedge(x, y), addedge(y, x); }

struct Matrix {
	ll a[2][2];
	inline Matrix() { memset(a, 0, sizeof(a)); }
	inline Matrix operator * (const Matrix &b) {
		Matrix c;
		c.a[0][0] = std::min(a[0][0] + b.a[0][0], a[0][1] + b.a[1][0]);
		c.a[0][1] = std::min(a[0][0] + b.a[0][1], a[0][1] + b.a[1][1]);
		c.a[1][0] = std::min(a[1][0] + b.a[0][0], a[1][1] + b.a[1][0]);
		c.a[1][1] = std::min(a[1][0] + b.a[0][1], a[1][1] + b.a[1][1]);
		return c;
	}
} v[N], t[N << 2];

inline void dfs1(int x, int fa = 0) {
	dep[x] = dep[fa] + 1, f[x] = fa, siz[x] = 1;
	for fec(i, x, y) if (y != fa) dfs1(y, x), siz[x] += siz[y], siz[y] > siz[son[x]] && (son[x] = y);
}
inline void dfs2(int x, int pa) {
	top[x] = pa, dfn[x] = ++dfc, pre[dfc] = x;
	if (!son[x]) return (void)(bot[x] = x);
	dfs2(son[x], pa), bot[x] = bot[son[x]];
	for fec(i, x, y) if (y != f[x] && y != son[x]) dfs2(y, y);
}
inline void dfs3(int x, int fa = 0) {
	for fec(i, x, y) if (y != fa) {
		dfs3(y, x);
		dp[x] += dp[y];
		if (y != son[x]) h[x] += dp[y];
	}
	if (!son[x]) dp[x] = h[x] = INF;
	smin(dp[x], a[x]);
}

inline void build(int o, int L, int R) {
	if (L == R) return t[o].a[0][0] = h[pre[L]], t[o].a[0][1] = a[pre[L]], (void)0;
	int M = (L + R) >> 1;
	build(lc, L, M), build(rc, M + 1, R);
	t[o] = t[lc] * t[rc];
}
inline void qadd(int o, int L, int R, int x) {
	if (L == R) return t[o].a[0][0] = h[pre[L]], t[o].a[0][1] = a[pre[L]], (void)0;
	int M = (L + R) >> 1;
	if (x <= M) qadd(lc, L, M, x);
	else qadd(rc, M + 1, R, x);
	t[o] = t[lc] * t[rc];
}
inline Matrix qsum(int o, int L, int R, int l, int r) {
	if (l <= L && R <= r) return t[o];
	int M = (L + R) >> 1;
	if (r <= M) return qsum(lc, L, M, l, r);
	if (l > M) return qsum(rc, M + 1, R, l, r);
	return qsum(lc, L, M, l, r) * qsum(rc, M + 1, R, l, r);
}

inline ll qry(int x) {
	const Matrix &tmp = qsum(1, 1, n, dfn[x], dfn[bot[x]]);
	assert(!tmp.a[1][0] && !tmp.a[1][1]);
	return std::min(tmp.a[0][0], tmp.a[0][1]);
}
inline void upd(int x, int k) {
	a[x] += k;
	while (top[x] != 1) {
		h[f[top[x]]] -= qry(top[x]);
		qadd(1, 1, n, dfn[x]);
		h[f[top[x]]] += qry(top[x]);
		x = f[top[x]];
	}
	qadd(1, 1, n, dfn[x]);
}

inline void work() {
	dfs1(1), dfs2(1, 1), dfs3(1), build(1, 1, n);
	read(m);
	while (m--) {
		static char opt[5];
		int x, y;
		scanf("%s", opt);
		if (*opt == 'Q') read(x), printf("%lld\n", qry(x));
		else read(x), read(y), upd(x, y);
	}
	
}

inline void init() {
	read(n);
	for (int i = 1; i <= n; ++i) read(a[i]);
	int x, y;
	for (int i = 1; i < n; ++i) read(x), read(y), adde(x, y);
}

int main() {
#ifdef hzhkk
	freopen("hkk.in", "r", stdin);
#endif
	init();
	work();
	fclose(stdin), fclose(stdout);
	return 0;
}

posted @ 2019-09-24 16:20 hankeke303 阅读(282) 评论(2) 收藏举报

刷新页面返回顶部

hankeke303

亦余心之所善兮，虽九死其犹未悔。

动态 DP 学习笔记

不用动态 DP 的做法

问题

动态 DP

公告