DP专题-学习笔记:概率/期望 DP
1. 前言
概率/期望 DP,是一种 DP,用来计算概率或者是期望。
其实我认为这种 DP 就是计算期望的,毕竟概率可以看成代价为 1 的期望。
没有学过期望的读者可以看看这篇文章:数学/数论专题-学习笔记:概率与期望
而概率/期望 DP,最关键的就是期望方程。
下面看一道例题。
2. 例题
以这题为例,详细讲解期望 DP 的一般套路。
为了方便,下面直接认为 \(p_i\) 就是概率。
首先设状态。
期望 DP 设状态:\(f[i]=从 1 到 i 的期望(天数/步数/代价/...)\)。
对于这道题,\(f_i\) 为从第一面镜子到第 \(i\) 面镜子都高兴的期望天数。
期望 DP 的转移:使用 \(f_{i-1},f_i\) 列期望方程。
列期望方程是重点!不能列错! 还有不要解错
- 第 \(i\) 天询问失败,从头开始。
此时概率为 \(1-p_i\),消耗天数为 \(f_{i-1}+1+f_i\),于是概率乘代价为 \((1-p_i)(f_{i-1}+1+f_i)\)。 - 第 \(i\) 天询问成功。
此时概率为 \(p_i\),消耗天数 \(f_{i-1}+1\),于是概率乘代价为 \(p_i(f_{i-1}+1)\)。
综上,有 \(f_i=(1-p_i)(f_{i-1}+1+f_i)+p_i(f_{i-1}+1)\)。
然而 \(p_i\) 只是概率,真正代码中还需要除以 100 才行。
除以 100 之后最后解得 \(f_i=\dfrac{100(f_{i-1}+1)}{p_i}\),线性递推即可,不要忘记逆元。
总结一下期望 DP 的一般套路:
- 设状态 \(f_i\) 为从 1 到 \(i\) 的期望天数/步数/...
- 列出关于 \(f_{i-1}\) 和 \(f_i\) 的期望方程。
- 解方程,然后线性递推。
- 如果有特别的初值要加上。
几个注意点:
- 期望方程不要列错,一定要考虑到每一种情况。
方程不要解错- 初值不能漏。
例题的代码:
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN = 2e5 + 10, P = 998244353;
int n, p[MAXN];
LL f[MAXN];
int read()
{
int sum = 0, fh = 1; char ch = getchar();
while (ch < '0' || ch > '9') {if (ch == '-') fh = -1; ch = getchar();}
while (ch >= '0' && ch <= '9') {sum = (sum << 3) + (sum << 1) + (ch ^ 48); ch = getchar();}
return sum * fh;
}
LL ksm(LL a, LL b)
{
LL ans = 1 % P;
for (; b; b >>= 1)
{
if (b & 1) ans = ans * a % P;
a = a * a % P;
}
return ans;
}
int main()
{
n = read();
for (int i = 1; i <= n; ++i) p[i] = read();
for (int i = 1; i <= n; ++i) f[i] = 100ll * (f[i - 1] + 1) % P * ksm(p[i], P - 2) % P;
printf("%lld\n", f[n]);
return 0;
}
3. 练习题
概率/期望 DP 的练习题请前往 DP专题-专项训练:概率/期望 DP + 数位 DP。