园龄：2年7个月粉丝：2 关注：2

数学期望DP学习笔记

数学期望： 在概率论和统计学中，数学期望(mathematic expectation)（或均值，亦简称期望）是试验中每次可能结果的概率乘以其结果的总和，是最基本的数学特征之一。它反映随机变量平均取值的大小。——摘自百度百科
不懂？~~太正常了，百度百科就是不写人话。~~
举个栗子解释一下：在一次膜你赛中，小 z 预估自己有 $0.5$ 的概率考 $300$ 分， $0.3$ 的概率考250分， $0.2$ 的概率考 $200$ 分，计算方法与加权平均值有些类似，那她得分的数学期望即是： $0.5 \times 300 + 0.3 \times 250 + 0.2 \times 200 = 265 p t s$ 。
具体地，记第 $i$ 种结果的概率为 $p_{i}$ ，结果得分为 $f_{i}$ ，那么 $x$ 的期望 $E (x) = \sum_{i = 1}^{x} p_{i} \times f_{i}$ 。
注意， $\sum_{i = 1}^{x} p_{i} = 1$ ，即所有概率总和必须是 $1$ 。

Problem1 P4316 绿豆蛙的归宿
题意简述
给出一张 DAG，保证连通图，随机行走，求 $1$ 到 $n$ 的路径长度期望。具体地，若当前在点 $u$ ，出边数为 $o d_{u}$ ，则走到每一条出边的概率相等，都为 $\frac{1}{o d_{u}}$ 。
题目解析
我们设 $f_{i}$ 表示从 $1$ 到 $i$ 的路径长度期望，答案显然是 $f_{n}$ 。
但手算样例，我们看到如下情况， $f_{1}$ 显然为 $0$ ， $f_{2}$ 易得为 $0.5$ ， $f_{3}$ 如何计算？

显然我们还需要考虑从 $1$ 到 $3$ 的概率。但我们感觉这种方法略微繁琐，正推不方便，不妨逆推，也就是设 $f_{i}$ 表示从 $i$ 到 $n$ 的路径长度期望，此时答案为 $f_{1}$ ，初始状态 $f_{n} = 0$ 。
可以得出转移方程，当前在点 $u$ ， $f_{u} = \frac{1}{o d_{u}} \times \sum f_{v} + w_{u, v}$ 。
实现中，我们要逆推，所以两种方法处理图：记忆化搜索或者建反图拓扑排序。
代码实现
$1.$ 记忆化搜索

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int N=1e5+10;
int n,m;
int x,y;
double z;
struct edge{int v,next;double w;}e[N<<1];
int head[N],tot;
inline void add(int u,int v,double w){e[++tot].v=v,e[tot].w=w,e[tot].next=head[u],head[u]=tot;}
double chu[N];
double f[N];

void dfs(int u){
	if(f[u]) return ;
	for(int i=head[u];i;i=e[i].next){
		int v=e[i].v;
		if(!f[v]) dfs(v);
		f[u]+=f[v]+e[i].w;
	}
	if(chu[u]) f[u]/=chu[u];
}

int main(){
	scanf("%d%d",&n,&m);
	for(int i=1;i<=m;++i) scanf("%d%d%lf",&x,&y,&z),add(x,y,z),chu[x]++; 
	dfs(1);
	printf("%.2lf",f[1]);
	return 0;
}

$2.$ 反图拓扑

#include<queue>
#include<cstdio>
#include<iostream>
using namespace std;
const int N=1e5+100;
const int M=2*N;
int n,m;
struct node{
	int ver,nxt;
	double edge;
}e[M];
int head[N],tot;
int in[N],out[N];
double f[N],g[N];
void add(int x,int y,double z){
	e[++tot]={y,head[x],z};
	head[x]=tot;
}
queue<int> q;
void topsort(){
	f[1]=0.0;
	g[1]=1.0;
	q.push(1);
	while(q.size()){
		int x=q.front();
		q.pop();
		for(int i=head[x];i;i=e[i].nxt){
			int y=e[i].ver;
			double z=e[i].edge;
			f[y]+=(f[x]+g[x]*z)/out[x];
			g[y]+=g[x]/out[x];
			in[y]--;
			if(in[y]==0){
				q.push(y);
			}
		}
	}
}
int main(){
	scanf("%d%d",&n,&m);
	for(int i=1;i<=m;i++){
		int x,y;
		double z;
		scanf("%d%d%lf",&x,&y,&z);
		add(x,y,z);
		in[y]++;
		out[x]++;
	}
	topsort();
	printf("%.2lf\n",f[n]);
	return 0;
}

（法 $2$ 代码来自此间的少年fu）。

Problem2 蓝桥杯 2022 省赛 A 组 E 题 ~~（蓝桥杯终于出了个好题。）~~
题意简述
有一只虫想要爬上高度为 $n$ 的树，初始位于树根, 即高度为 $0$ ，当它从高度 $i - 1$ 爬到高度 $i$ 时有 $p_{i}$ 的概率掉回树根, 求它从树根爬到树顶时，花费总时间的数学期望（一次尝试向上爬花费时间为 $1$ ）。
题目解析
类似的套路，我们设 $f_{i}$ 表示从 $i$ 爬到 $n$ 时间的数学期望，答案即为 $f_{0}$ 。
则从 $i$ 成功上到 $i + 1$ 的概率是 $1 - p_{i + 1}$ ，掉回树根的概率 $p_{i + 1}$ ，初始状态 $f_{n} = 0$ 。
易得： $f_{i} = 1 + (1 - p_{i + 1}) \times f_{i + 1} + p_{i + 1} \times f_{0}$ 。
发现此时的 $f_{i}$ 与 $f_{i + 1}$ 和 $f_{0}$ 有关。有后效性的 DP？怎么办呢？
我们尝试多写几项寻找一下规律：
$f_{0} = 1 + (1 - p_{1}) \times f_{1} + p_{1} \times f_{0}$
$f_{1} = 1 + (1 - p_{2}) \times f_{2} + p_{2} \times f_{0}$
$f_{2} = 1 + (1 - p_{3}) \times f_{3} + p_{3} \times f_{0}$
解方程组……高斯消元会 TLE……
于是直接代入可得 $f_{0} = 1 + (1 - p_{1}) + (1 - p_{1}) \times (1 - p_{2}) + (1 - p_{1}) \times (1 - p_{2}) \times (1 - p_{3}) \times f_{n} + [p_{1} + (1 - p_{1}) \times p_{2} + (1 - p_{1}) \times (1 - p_{2}) \times p_{3}] \times f_{0}$

上一篇NOIP2022游寄

下一篇CF1840C题解

posted @ 2023-05-27 12:10 Mr_KaYa 阅读(63) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

Mr-KaYa

数学期望DP学习笔记

公告

常用链接

我的标签

随笔档案

阅读排行榜