[正睿集训2021] 概率与期望

前置知识

期望的线性性

第一个性质是期望的可加性：

\[E(X+Y)=E(X)+E(Y) \]

\[E(aX)=aE(X) \]

第二个性质是当随机变量 $X$ 和 $Y$ 独立时：

\[E(XY)=E(X)E(Y) \]

条件概率

在 $B$ 成立的前提下 $A$ 成立的概率等于 $AB$ 同时成立的概率除以 $B$ 成立的概率：

\[P(A|B)=\frac{P(AB)}{P(B)} \]

贝叶斯公式同理：

$%$$$P(A|B)=\frac{P(B|A)P(A)}{P(B)}$$

方差相关

\[Var(X)=\frac{1}{n}\sum_{i=1}^n(x_i-\overline x)^2=\frac{1}{n}\sum_{i=1}^n x_i^2-2\overline xx_i+\overline x^2=\frac{\sum_{i=1}^nx_i^2}{n}-\overline x^2=E(x^2)-E(x)^2 \]

概率生成函数

对于任意取值在非负整数集上的离散随机变量 $X$，他的概率生成函数为：

\[F(x)=\sum_{i=0}^\infty P(x=i)x^i \]

一些性质：

\[F(1)=1 \]

\[E(X)=F'(1) \]

\[E(x^{\underline k})=F^{(k)}(1) \]

\[E(x^k)=\sum_{i=0}^kS(k,i)E(x^{\underline i})=\sum_{i=0}^k S(k,i)F^{(i)}(1) \]

Game on Tree

题目描述

点此看题

解法

可以考虑每个点对期望操作次数的贡献，一个点期望产生 $1$ 的贡献，当且仅当它比它的祖先先被染色，这样的概率是 $\frac{1}{dep_i}$，所以每个点贡献的期望是 $\frac{1}{dep_i}$

那么根据期望的线性性，答案就是 $\sum \frac{1}{dep_i}$

Forest game

题目描述

给定一棵 $n$ 个节点的树，每次等概率选择一个点，删去它和所有和它相连的边，得分记为这个连通块大小，总得分为每次操作得分之和，求总得分的期望。

$n\leq 100000$

解法

好像每次的得分是连通块大小，这个贡献好像不是很好算。考虑把它拆成更小的贡献 ，考虑删去 $u$ 点时 $v$ 点对它有没有贡献，当且仅当 $u$ 是 $(u,v)$ 路径上第一个被删去的节点，期望是 $\frac{1}{dis(u,v)+1}$

根据期望的线性性，答案是 $\sum_u\sum_v\frac{1}{dis(u,v)+1}$

这种树上路径问题就可以考虑点分治，但是这个题要把每个距离有多少个给算出来。对于分治中心，考虑每个子树的生成函数，我们把它们暴力求卷积即可，再减去子树内部自己的卷积就可以了。时间复杂度 $O(n\log^2 n)$，$\tt FFT$ 要打递归版本的。

#include <cstdio>
#include <iostream>
#include <cmath>
using namespace std;
const int M = 400005;
const int p = 1e9+7;
const double pi = acos(-1.0);
#define ll long long
int read()
{
	int x=0,f=1;char c;
	while((c=getchar())<'0' || c>'9') {if(c=='-') f=-1;}
	while(c>='0' && c<='9') {x=(x<<3)+(x<<1)+(c^48);c=getchar();}
	return x*f;
}
int n,tot,len,up,rt,ans,sz;
int f[M],siz[M],mx[M],vis[M],rev[M];
struct edge
{
	int v,next;
	edge(int V=0,int N=0) : v(V) , next(N) {}
}e[2*M];
struct complex
{
	double x,y;
	complex() {}
	complex(double X,double Y) : x(X) , y(Y) {}
	complex operator + (const complex &R) const {return complex(x+R.x,y+R.y);}
	complex operator - (const complex &R) const {return complex(x-R.x,y-R.y);}
	complex operator * (const complex &R) const {return complex(x*R.x-y*R.y,x*R.y+y*R.x);} 
}a[M];
void FFT(complex *a,int len,int fl)
{
	for(int i=0;i<len;i++)
	{
		rev[i]=(rev[i>>1]>>1)|((i&1)*(len/2));
		if(i<rev[i]) swap(a[i],a[rev[i]]);
	}
	for(int s=2;s<=len;s<<=1)
	{
		int t=s/2;complex w=complex(cos(2*pi/s),sin(2*pi/s)*fl);
		for(int i=0;i<len;i+=s)
		{
			complex x=complex(1,0);
			for(int j=0;j<t;j++,x=x*w)
			{
				complex fe=a[i+j],fo=a[i+j+t];
				a[i+j]=fe+x*fo;
				a[i+j+t]=fe-x*fo;
			}
		}
	}
}
int jzm(int a,int b)
{
	int r=1;
	while(b>0)
	{
		if(b&1) r=1ll*r*a%p;
		a=1ll*a*a%p;
		b>>=1;
	}
	return r;
}
void find(int u,int fa,int sz)
{
	siz[u]=1;mx[u]=0;
	for(int i=f[u];i;i=e[i].next)
	{
		int v=e[i].v;
		if(v==fa || vis[v]) continue;
		find(v,u,sz);
		siz[u]+=siz[v];
		mx[u]=max(mx[u],siz[v]);
	}
	mx[u]=max(mx[u],sz-siz[u]);
	if(mx[u]<mx[rt]) rt=u;
}
void dfs(int u,int fa,int d)
{
	sz++;
	a[d].x=a[d].x+1;up=max(up,d+1);
	for(int i=f[u];i;i=e[i].next)
	{
		int v=e[i].v;
		if(v==fa || vis[v]) continue;
		dfs(v,u,d+1);
	}
}
void work(int fl)
{
	len=1;
	while(len<2*up) len<<=1;
	FFT(a,len,1);
	for(int i=0;i<len;i++) a[i]=a[i]*a[i];
	FFT(a,len,-1);
	for(int i=0;i<len;i++)
	{
		ll tmp=(ll)(a[i].x/len+0.5);
		tmp%=p;
		ans=(ans+fl*tmp*jzm(i+1,p-2))%p;
		a[i].x=a[i].y=0;
	}
}
void solve(int u)
{
	up=0;dfs(u,0,0);
	work(1);
	vis[u]=1;
	for(int i=f[u];i;i=e[i].next)
	{
		int v=e[i].v;
		if(vis[v]) continue;
		up=sz=0;dfs(v,0,1);
		work(-1);
		rt=0;find(v,0,sz);
		solve(rt);
	}
}
signed main()
{
	n=read();
	for(int i=1;i<n;i++)
	{
		int u=read(),v=read();
		e[++tot]=edge(v,f[u]),f[u]=tot;
		e[++tot]=edge(u,f[v]),f[v]=tot;
	}
	mx[0]=n;
	find(1,0,n);
	solve(rt);
	ans=(ans+p)%p;
	for(int i=1;i<=n;i++) ans=1ll*ans*i%p;
	printf("%d\n",ans);
}

[CTSC2017] 游戏

题目描述

点此看题

解法

暴力 $dp$ 是很容易的，但是如果要涉及到修改我们就束手无策了。考虑一些已知的比赛信息会把原序列划分成若干个段 $[i,j)$，对于每个段的贡献是独立的，现在问题变成了算一段的贡献，可以考虑线段树维护之类的方法。

那么我们要维护的东西一定要是 支持快速合并的 ，并且还要 钦定两端的状态 ，分别维护概率和期望。设 $P_{i,j}(x,y)$ 表示 $i$ 局输赢状态 $x$，$j$ 局输赢状态 $y$ 的概率，$E_{i,j}(x,y)$ 表示 假定这种输赢状态为前提 下 $[i,j]$ 赢得的期望场数，$pro[i][j][k]$ 表示 $i-1$ 轮状态是 $j$，$i$ 轮状态是 $k$ 的概率（其实就是题目给的概率数组），那么有如下转移：

\[P_{i,j}(x,y)=\sum_z\sum_wP_{i,pos}(x,z)\times P_{pos+1,j}(w,y)\times pro_{pos+1,z,w} \]

上面的式子很好理解，就是枚举中间的输赢情况是什么然后合并。

\[E_{i,j}(x,y)=\frac{\sum_z\sum_w(P_{i,pos}(x,z)\times P_{pos+1,j}(w,y)\times pro_{pos+1,z,w})\times(E_{i,pos}(x,z)+E_{pos+1,j}(w,y))}{P_{i,j}(x,y)} \]

上面式子的本质其实是条件概率的一个应用：$E(A|B)=\frac{E(AB)}{P(B)}$，我们要求的是有假定前提的期望，但是分子算的是包含假定前提成立的期望，所以除以假定前提成立的概率就行，这里的假定前提就是 $i,j$ 的输赢状态分别是 $x,y$

用线段树很容易维护上面那个东西，修改就维护一个 $set$，找一下前驱后继随便改一改就行了。

矩形覆盖

题目描述

给定一个大小为 $n\times m$ 的矩形，某一些格子上有物品，共有 $k$ 个物品，现在等概率选一个子矩形，求子矩形内物品个数的方差期望。

$n,m\leq 1e9,k\leq 1e5$

解法

根据方差期望那套理论，我们分别求出 $E(x)$ 和 $E(x^2)$ 即可。

$E(x)$ 比较好求，对于每一个点统计它的贡献，对于 $(x,y)$ 有 $x\times (n-x+1)\times y\times(m-y+1)$

$E(x^2)$ 可以套路地考虑每一对点，统计包含它们的矩形的个数，可以考虑扫描线，分左上右下和右上左下两种情况讨论，然后离散化$\tt + BIT$ 即可。~~相信你们都知道我的意思了~~

逃跑

题目描述

点此看题

解法

还是求方差期望的题，按照套路我们将其转化为分别求 $E(x)$ 和 $E(x^2)$

先考虑怎么求 $E(x)$，设 $f(i,j,k)$ 表示第 $i$ 秒第一次移动 $(j,k)$ 的概率，设 $g(i,j,k)$ 表示第 $i$ 秒移动 $(j,k)$ 的概率， 注意上面的定义位置是相对的 。对于 $(0,0)$ 它的含义就变成了到达，所以答案是所有 $f(i,j,k)$ 的和，$g$ 可以较为容易地用 $dp$ 求出。对于一个点 $(x,y)$ 我们单独用生成函数算他的 $f$：

\[F(x)=\sum_{i=0}^\infty f(i,x,y)x^i,G(x)=\sum_{i=0}^\infty g(i,x,y)x^i,H(x)=\sum_{i=0}^\infty g(i,0,0)x^i \]

那么满足下列关系式，含义就是花了时间不移动（注意相对的概念哦）：

\[G(x)=F(x)H(x),F(x)=\frac{G(x)}{H(x)} \]

$\tt Therefore$，$f$ 可以在 $O(n^4)$ 的时间复杂度内求得（可以写一个暴力多项式除法）

现在考虑 $E(x^2)$ 怎么求，按照套路我们要对每一对点算贡献。考虑用 $dp$ 处理，下面的操作就真的是艺高人胆大了，设 $h(i,j,k)$ 表示第 $i$ 秒第一次走到了 $(a+j,b+k)$，之前已经到达了 $(a,b)$，对于所有位置 $(a,b)$ 的概率，显然把最后时刻所有位置的 $h$ 求和就是答案。这个状态定义为什么牛逼呢？因为它省略了状态里需要枚举的 $(a,b)$，但令人惊奇的是这样还能转移！

转移就先枚举 $a,b$，再枚举一个时刻 $t$，那我们就让它在 $t$ 时刻第一次走到 $(a,b)$，在剩下 $i-t$ 时间内第一次走到 $(a+j,b+k)$。但是这样显然会算错，因为可能在走到 $(a,b)$ 的时候已经走到 $(a+j,b+k)$ 了。枚举一个时刻 $t$，$h(t,-j,-k)$ 就是经过 $(a+j,b+k)$ 第一次走到 $(a,b)$ 的方案，然后再第一次走到 $(a+j,b+k)$（这里的第一次指的是这次征程的第一次），那么汇总一下就这么转移：

\[h(i,j,k)=\sum_{t<i,a,b}f(t,a,b)f(i-t,j,k)-\sum_{t<i}h(t,-j,-k)f(i-t,j,k) \]

前面那一项是个人就会优化，所以时间复杂度 $O(n^4)$

[CTSC2006] 歌唱王国

题目描述

点此看题

解法

这种题一般有套路的：列方程解生成函数 ，设 $f[i]$ 表示结束时长度是 $i$ 的概率，$g[i]$ 表示长度是 $i$ 还没有结束的概率，设 $F(x)$ 为 $f[i]$ 的生成函数，$G(x)$ 为 $g[i]$ 的生成函数，现在的任务是列出方程。

首先根据定义有：$f[i]=g[i-1]-g[i],f[0]=0,g[0]=1$，那么可以推出 $F(x)=xG(x)-G(x)+1$

还要有一个方程才行，考虑 $f,g$ 之间的联系，我们必须列一个方程来表示 $f,g$ 之间的相互转化，考虑在 $g$ 后面直接加入牛头人的名字 $A$，设牛头人的名字长度是 $L$，但是要考虑一种情况，就是没有加到 $L$ 就已经合法了，但这时候 $f$ 的后缀一定是 $A$ 的一个 $\tt border$，建议结合图来理解这个方程怎么来的：

那么我们枚举 $\tt border$ 的长度 $i$ 就可以写出下列方程，注意我们列的是生成函数的方程，但原理是根据单个项的等式关系来的，所以要注意 对齐项数 ，设 $a_i$ 表示 $[1,i]$ 是否是 $A$ 的一个 $\tt border$：

\[(\frac{x}{m})^LG(x)=\sum_{i=1}^La_i(\frac{x}{m})^{L-i}F(x) \]

剩下的问题就是解方程了，由于求的是结束时间的期望那么答案是 $F'(1)$，我们先把第一个方程求导：

\[F'(x)=G(x)+xG'(x)-G'(x)=(x-1)G'(x)+G(x) \]

然后将 $x=1$ 带入上面的式子：

\[F'(1)=G(1) \]

那么问题变成了求 $G(1)$，尝试用第二个式子把 $x=1$ 带进去：

\[(\frac{1}{n})^mG(1)=\sum_{i=1}^ma_i\cdot F(1)\cdot(\frac{1}{n})^{m-i} \]

\[G(1)=\sum_{i=1}^ma_i\cdot F(1)\cdot n^i \]

\[G(1)=\sum_{i=1}^ma_i\cdot n^i \]

\[F'(1)=\sum_{i=1}^ma_i\cdot n^i \]

大功告成啦！~~所以代码还需要我给么~~

Dice

题目描述

有一个 $m$ 面的骰子，求扔连续 $n$ 次就相同就结束的期望部分和扔连续 $n$ 次结果不同就结束的期望步数。

$n,m\leq 1e6$

解法

解法只有一句话：照葫芦画瓢

第一问（注意第二个方程左边是一定成立的概率）：

\[F(x)=xG(x)-G(x)+1 \]

\[(\frac{x}{m})^n\cdot m\cdot G(x)=\sum_{i=1}^n(\frac{x}{m})^{n-i}F(x) \]

\[F'(1)=\frac{m^n-1}{m-1} \]

第二问：

\[F(x)=xG(x)-G(x)+1 \]

\[(\frac{x}{m})^n\frac{m!}{(m-n)!}G(x)=\sum_{i=1}^n(\frac{x}{m})^{n-i}\frac{(m-i)!}{(m-n)!}F(x) \]

\[F'(1)=\sum_{i=1}^n m^i\frac{(m-i)!}{m!} \]

如果你想从 $n-1$ 来推也是可以的，只不过要注意去掉 $g_0$ 那一项。

哥哥

懒得写了

posted @ 2021-02-22 12:08 C202044zxy 阅读(208) 评论(0) 编辑收藏举报

刷新页面返回顶部

C202044zxy

[正睿集训2021] 概率与期望

前置知识

Game on Tree

Forest game

[CTSC2017] 游戏

矩形覆盖

逃跑

[CTSC2006] 歌唱王国

Dice

哥哥

公告