uva 10529 Dumb Bones(概率与期望,期望dp)带公式推导题解

\(dp[i]\)表示放置连续的\(i\)个骨牌所需要的期望步数,按照区间DP的思想,它是来自一个\(l+1+r\)的区间的,这里的\(+1\)就是最后放的那块,且\(l+1+r=i\),下面来考虑转移。

首先,假设骨牌倒了之后不会碰倒两边的骨牌,则有转移:

\[dp[i]=dp[l]+dp[r]+\frac{1}{1-pl-pr} \]

最后一项是放置\(+1\)的骨牌所需要的次数,这里应用了“概率倒数为发生一次的期望”这个知识。

现在考虑会碰倒两边骨牌的情况,感性认知一下,这会使得期望步数增加,增加的就是要把碰到的骨牌复原的次数。

那么往左倒的次数为\((\frac{1}{1-pl-pr}-1)*\frac{pl}{pl+pr}=\frac{pl}{1-pl-pr}\)\(-1\)是因为要除去最后一次摆成功的那一次,乘以\(\frac{pl}{pl+pr}\)是根据条件概率公式所得到的。那么向左倒使得期望增加的值就是\(\frac{pl}{1-pl-pr}dp[l]\),也就是我们求出了向左倒的期望次数,每一次都需要我们重新摆\(dp[l]\),因此二者相乘。注意,一开始我算成了\(\frac{pl}{1-pl-pr}(dp[l]+1)\),这是错误的,因为这个\(+1\)所代表的失败其实包含在了\(\frac{1}{1-pl-pr}\)里了。

类似的,向右倒的次数为\(\frac{pr}{1-pl-pr}\),带来的期望增加为\(\frac{pr}{1-pl-pr}dp[r]\)

综上,有:

\[dp[i]=dp[l]+dp[r]+\frac{1}{1-pl-pr}+\frac{pr}{1-pl-pr}dp[r]+\frac{pl}{1-pl-pr}dp[l]=\frac{(1-pr)dp[l]+(1-pl)dp[r]+1}{1-pl-pr} \]

进行转移即可,注意枚举的范围不要错(很容易漏掉边界之一,我因为这个wa了两发)。

代码:

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,n) for(int i=a;i<=n;i++)
#define per(i,a,n) for(int i=n;i>=a;i--)
#define pb push_back
#define SZ(x) ((int)(x).size())
#define fastin ios::sync_with_stdio(0);cin.tie(0);cout.tie(0)
typedef long long ll;
typedef pair<int,int> pii;
typedef double db;
int n;
db pl,pr,dp[1010];
int main(){
	while(scanf("%d",&n)){
		if(!n)	break;
		scanf("%lf%lf",&pl,&pr);
		rep(i,1,n){
			dp[i]=1e15;
		}
		dp[0]=0;dp[1]=1/(1-pl-pr);
		rep(i,2,n){
			rep(l,0,i-1){
				int r=i-(l+1);
				dp[i]=min(dp[i],
					(1-pr)/(1-pl-pr)*dp[l]+(1-pl)/(1-pl-pr)*dp[r]+1/(1-pl-pr));
			}
		}
		printf("%.2f\n",dp[n]);
	}
	return 0;
}
posted @ 2020-07-22 17:31  炸鸡块君  阅读(117)  评论(0编辑  收藏  举报