概率生成函数学习笔记

简称 PGF。

哪个天才把多项式出到概率上的啊

性质#

设一个多项式 F(x)=P(X=i)xi

然后会发现这玩意有一堆性质,然后就被出成题了。。。

  • F(1)=1 。这个显然,所有情况的概率和就是 1P(X=i)=1
  • E(X)=F(1)

E(X)=i×P(X=i) 带系数,怎么搞?求个导,就有 i 了。

  • E(Xk_)=F(k)(1)k 阶导)。

上面那个式子多求几次导即可。

或许有人和我一样不知道 E(Xk_) 是啥意思。。。E(Xk_)=P(X=i)ik_

  • E(X2)=F(x)+F(x)

E(X2)=E(X2_+X1_)=E(X2_)+E(X1_)=F(x)+F(x)

  • 方差 V(X)=F(1)+F(1)F(1)2

V(x)=E(X2)E(X)2=F(1)+F(1)F(1)2

  • 补充一下 V(X)=E(X2)E(X)2 是怎么推出来的,我自己想了好久,最后是在别人的提醒下翻了《具体数学》第八章明白的。

V(X)=E((XE(X))2)=E(X22XE(X)+E(X)2)=E(X2)+E(X)22E(X)E(X)

主要是上面那步理解了好久,因为 E(X) 是个常数,所以 E(E(X)2)=E(X)2 被直接提了出来。E(X E(X))=E(X)E(E(X))=E(X)2 ,这个用期望的线性性+乘法分配律即证。

=E(X2)E(X)2

所以,方差等于“随机变量平方的均值减去其均值的平方”

然后就可以做题了。。。


例1#

P4548 [CTSC2006]歌唱王国

好像是个套路,但是真的nb

[xn]F(x) 为第 n 轮恰好唱出一个名字的概率,[xn]G(x) 表示 n 轮之后还没有唱出名字的概率。

那么

F(x)+G(x)=xG(x)+1

上一轮如果还得接着唱,那么再唱一轮只可能结束或者没结束。后面那个 1 就是你唱了 0 轮必然唱不出名字,然而因为 G(x) 乘了 x 常数项没了要手动补上。怎么感觉是废话,但是这个式子很有用

首先,根据上面性质那部分推导,我们要求的是 F(1)

上面那个式子两边求导

F(x)+G(x)=G(x)+xG(x)

直接把 x=1 带进去

F(1)=G(1)

所以只要求 G(1) 就行了。

还有一波骚操作可以导出 F(x),G(x) 的关系。

考虑如何表示出一个必然结束的情况。

G(x) 来写就是 G(x)(xn)m ,也就是暴力在后面接上一个名字。

但是有可能会存在提前结束的情况。

非常神奇的是用 F(x) 能写出一个有相同组合意义的式子,所以并不用管提前结束这玩意。

显然,G(x) 那个式子有可能提前结束当且仅当现在这个串的末尾是原串的 Border

事实上这东西并不严格是 Border ,因为 Border 不能等于自身,但是这题可以。能懂就好了qwq

Ai 表示 [S[1,,i]=S[mi+1,m]] 也就是是否为 Border

i=1mAiF(x)(xn)mi

后面那个幂次是补上剩下的操作。其实可以理解成枚举在哪个位子提前结束。

所以现在我们得到的是

G(x)(xn)m=i=1mAiF(x)(xn)mi

带入 x=1

G(1)(1n)m=i=1mAiF(1)(1n)mi

再用性质里头那个 F(1)=1 ,两边同时乘 nm 得到

G(1)=i=1mAini

感觉好牛逼啊,第一次把具体值往生成函数里代诶。

关于怎么求 Ai ,记住一句曾经在我们班广泛流传的一句话:BorderBorderBorder 。很有用的(

const int N=100005;
#define mod 10000
void fmod(int&x){x-=mod,x+=x>>31&mod;}
int n,m,p[N],a[N],ans;
bool A[N];
void print(int n){
   int d[5];d[0]=0;
   for(;n;n/=10)d[++d[0]]=n%10;
   while(d[0]<4)d[++d[0]]=0;
   while(d[0])printf("%c",'0'+d[d[0]--]);
   puts("");
}
signed main(){
   n=read();
   for(int T=read();T;--T){
   	m=read(),ans=0;
   	rep(i,1,m)a[i]=read(),A[i]=0;
   	p[1]=0;
   	int j=0;
   	for(int i=2;i<=m;++i){
   		while(j&&a[j+1]!=a[i])j=p[j];
   		if(a[j+1]==a[i])++j;
   		p[i]=j;
   	}
   	j=m;
   	while(j)A[j]=1,j=p[j];
   	for(int i=1,j=n;i<=m;++i,j=1ll*j*n%mod)if(A[i])fmod(ans+=j);
   	print(ans);
   }
}

例2#

P3706 [SDOI2017]硬币游戏

[xn]G(x) 表示 n 轮之后仍未结束的概率。

考虑答案怎么表示。不能像上面只开一个了。但是注意到 n 很小,于是可以开 n 个。

[xn]Fi(x) 表示第 i 个人在第 n 轮获胜的概率。

和上一题一样,考虑搞一个必然结束的式子出来:

G(x)(x2)m

随便在后面接一个串就好了,不妨接上第 i 个。

对于 Fi(x) 可以列一个和上面组合意义相同的式子。

j=1nk=1mAi,j,kFj(x)(x2)mk

其中 Ai,j,k=[Si[1,,k]=Sj[mk+1,,m]] 可以哈希 O(n3) 搞。

还是在枚举在哪个地方出现了提前结束的情况。

所以对于每一个 i[1,n] 都有

G(x)(x2)m=j=1nk=1mAi,j,kFj(x)(x2)mk

还有一个式子是

G(x)+i=1nFi(x)=xG(x)+1

就是第 i1 轮没有结束,那么第 i 轮只有没结束和结束两种状态。

我们要求的是所有的 Fi(1)

x=1 带入第二个式子

i=1nFi(1)=1

然后把第一个式子两边带入 x=1

G(1)(12)m=j=1nk=1mAi,j,kFj(1)(12)mkG(1)=j=1nk=1mAi,j,kFj(1)2k

n+1 个未知数 n+1 个方程直接高消就好了。

但是 2300 次方是啥玩意啊。然后我去看了看题解区有什么高妙做法

woc这玩意double居然能存,存完还能高消,怎么这么nb啊,而且我还不会卡诶(

woc为啥题解都能跑,我就被卡精度了啊/kk

woc我为啥 2300 开的是 int 啊,手残手残,我是傻逼。。。然后就过了qwq

#include<bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define mkp(x,y) make_pair(x,y)
#define pb(x) push_back(x)
#define sz(v) (int)v.size()
typedef long long LL;
typedef double db;
template<class T>bool ckmax(T&x,T y){return x<y?x=y,1:0;}
template<class T>bool ckmin(T&x,T y){return x>y?x=y,1:0;}
#define rep(i,x,y) for(int i=x,i##end=y;i<=i##end;++i)
#define per(i,x,y) for(int i=x,i##end=y;i>=i##end;--i)
inline int read(){
	int x=0,f=1;char ch=getchar();
	while(!isdigit(ch)){if(ch=='-')f=0;ch=getchar();}
	while(isdigit(ch))x=x*10+ch-'0',ch=getchar();
	return f?x:-x;
}
const int N=305;
#define mod1 998244353
#define mod2 1000000007
#define base1 31
#define base2 37
int n,m,H1[N][N],H2[N][N],pw1[N],pw2[N];
db a[N][N],ans[N],pw[N];
int hash1(int id,int l,int r){
	return (H1[id][r]-1ll*H1[id][l-1]*pw1[r-l+1]%mod1+mod1)%mod1;
}
int hash2(int id,int l,int r){
	return (H2[id][r]-1ll*H2[id][l-1]*pw2[r-l+1]%mod2+mod2)%mod2;
}
void Gauss(int n){
	rep(i,1,n){
		int mx=i;
		rep(j,i,n)if(fabs(a[j][i])>fabs(a[mx][i]))mx=j;
		if(mx!=i)rep(j,1,n+1)swap(a[mx][j],a[i][j]);
		rep(j,1,n){
			if(i==j)continue;
			db div=a[j][i]/a[i][i];
			rep(k,i,n+1)a[j][k]-=a[i][k]*div;
		}
	}
	rep(i,1,n)ans[i]=a[i][n+1]/a[i][i];
}
signed main(){
	n=read(),m=read();
	pw[0]=pw1[0]=pw2[0]=1;
	rep(i,1,m)pw1[i]=1ll*pw1[i-1]*base1%mod1,pw2[i]=1ll*pw2[i-1]*base2%mod2,pw[i]=2.*pw[i-1];
	rep(i,1,n){
		static char str[N];scanf("%s",str+1);
		rep(j,1,m)H1[i][j]=(1ll*H1[i][j-1]*base1+(str[j]=='H')+1)%mod1,H2[i][j]=(1ll*H2[i][j-1]*base2+(str[j]=='H')+1)%mod2;
	}
	rep(i,1,n){
		db res=0;
		rep(j,1,n)rep(k,1,m)
			if(hash1(i,1,k)==hash1(j,m-k+1,m)&&hash2(i,1,k)==hash2(j,m-k+1,m))a[i][j]+=pw[k];
		a[i][n+1]=-1,a[i][n+2]=0;
	}
	rep(i,1,n)a[n+1][i]=1;a[n+1][n+1]=0,a[n+1][n+2]=1;
	Gauss(n+1);
	for(int i=1;i<=n;++i)printf("%.10lf\n",ans[i]);
	return 0;
}

预告:可能还会有道例题,等我会做了再放上来。。。

upd:例题没了,因为我不会做。

upd 2021.5.18:真的又做到概率生成函数题了,搬运题解(

例3#

P6125 [JSOI2009]有趣的游戏

n 个生成函数 Fi(x)[xk]Fi(x) 表示第 i 个人在第 k 轮获胜的概率。

再设一个生成函数 G(x)[xk]G(x) 表示游戏在第 k 轮仍未结束的概率。

接下去可以得到若干等式:

i=1nFi(x)+G(x)=xG(x)+1

即在第 i1 轮没有结束的概率等于在第 i 轮结束的概率加上没结束的概率,或许写成 fi+gi=gi1 更好理解。

然后对于每一个 1in 都可以列出下面的等式

G(x)xlPi,1,l=j=1nk=1l[Si[1,k]=Sj[lk+1,l]]Fj(x)xlkPi,lk+1,l

其中 Pi,l,r 表示出现 Si[l,r] 的概率。

等式左边的含义是给没结束的字符串接上一个字符串让他结束,但是也会存在撞上另一个人的串导致提前结束的情况。

等式右边就是所有可以结束的状况的和。一个串 j 已经结束之后又接上了 Si[1,lk] 所以除掉 Pi,lk+1,l

可以发现两边组合意义相同。

因为个人习惯,把 P 的定义改成前缀和,减小一些常数,即 Pi,k 表示出现 Si[1,k] 的概率,化简一下可以得到:

G(x)xl=j=1nk=1l[Si[1,k]=Sj[lk+1,l]]Fj(x)xlk/Pi,k

然后注意到每个人获胜的概率就是 Fi(1),那么把 x=1 带进去。

i=1nFi(1)=1

G(1)=j=1nk=1l[Si[1,k]=Sj[lk+1,l]]Fj(x)/Pi,k

n+1 个方程 n+1 个未知数直接高斯消元,复杂度 O(n3)

注意到这个方程在所有串都不可能得到的情况下会无解要特判。然后还有一堆奇怪的边界要注意,看个人写法了,主要是除以 0 的情况要小心。

#include<bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define mkp(x,y) make_pair(x,y)
#define pb(x) push_back(x)
#define sz(v) (int)v.size()
typedef long long LL;
typedef double db;
template<class T>bool ckmax(T&x,T y){return x<y?x=y,1:0;}
template<class T>bool ckmin(T&x,T y){return x>y?x=y,1:0;}
#define rep(i,x,y) for(int i=x,i##end=y;i<=i##end;++i)
#define per(i,x,y) for(int i=x,i##end=y;i>=i##end;--i)
inline int read(){
	int x=0,f=1;char ch=getchar();
	while(!isdigit(ch)){if(ch=='-')f=0;ch=getchar();}
	while(isdigit(ch))x=x*10+ch-'0',ch=getchar();
	return f?x:-x;
}
const int N = 13;
const int base = 11;
const int mod = 20050103;// tommy0103/qq
//忽然发现不用取模,但是上面那行不想删了( 
int n, l, m, s[N][N];
db p[N], P[N][N], a[N][N], ans[N];
LL H[N][N], pw[N];
inline LL getHash(int i, int l, int r) {
	return H[i][r] - H[i][l - 1] * pw[r - l + 1];
}
inline void Gauss(int n) {
	rep(i, 1, n) {
		int mx = i;
		rep(j, i + 1, n) if(fabs(a[j][i]) > fabs(a[mx][i])) mx = j;
		if(mx != i) { rep(j, 1, n + 1) swap(a[mx][j], a[i][j]); }
		rep(j, 1, n) {
			if(i == j) continue;
			db d = a[j][i] / a[i][i];
			rep(k, i, n + 1) a[j][k] -= a[i][k] * d;
		}
	}
	rep(i, 1, n) ans[i] = a[i][n + 1] / a[i][i];
}
signed main() {
	n = read(), l = read(), m = read();
	rep(i, 1, m) p[i] = read(), p[i] /= read();
	pw[0] = 1;
	rep(i, 1, l) pw[i] = pw[i - 1] * base;
	rep(i, 1, n) {
		static char str[N];
		scanf("%s", str + 1), P[i][0] = 1;
		rep(j, 1, l)
			s[i][j] = str[j] - 'A' + 1,
			H[i][j] = H[i][j - 1] * base + s[i][j],
			P[i][j] = P[i][j - 1] * p[s[i][j]];
	}
	bool flg = 1;
	rep(i, 1, n) {
		if(P[i][l] < 1e-11) {
			a[i][i] = 1;
			continue;
		}
		flg = 0;
		rep(j, 1, n) if(P[j][l] > 1e-11) {
			rep(k, 1, l) if(getHash(i, 1, k) == getHash(j, l - k + 1, l))
				a[i][j] += 1. / P[i][k];
		}
		a[i][n + 1] = -1, a[i][n + 2] = 0;
	}
	if(flg) {
		rep(i, 1, n) puts("0.00");
		return 0;
	}
	rep(i, 1, n) a[n + 1][i] = 1;
	a[n + 1][n + 1] = 0, a[n + 1][n + 2] = 1;
	Gauss(n + 1);
	rep(i, 1, n) printf("%.2lf\n", ans[i] < 1e-5 ? 0. : ans[i]);
	return 0;
}
posted @   zzctommy  阅读(282)  评论(5编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话
点击右上角即可分享
微信分享提示
主题色彩