uva 10529 Dumb Bones（概率与期望，期望dp）带公式推导题解

令\(dp[i]\)表示放置连续的\(i\)个骨牌所需要的期望步数，按照区间DP的思想，它是来自一个\(l+1+r\)的区间的，这里的\(+1\)就是最后放的那块，且\(l+1+r=i\)，下面来考虑转移。

首先，假设骨牌倒了之后不会碰倒两边的骨牌，则有转移：

\[dp[i]=dp[l]+dp[r]+\frac{1}{1-pl-pr} \]

最后一项是放置\(+1\)的骨牌所需要的次数，这里应用了“概率倒数为发生一次的期望”这个知识。

现在考虑会碰倒两边骨牌的情况，感性认知一下，这会使得期望步数增加，增加的就是要把碰到的骨牌复原的次数。

那么往左倒的次数为\((\frac{1}{1-pl-pr}-1)*\frac{pl}{pl+pr}=\frac{pl}{1-pl-pr}\)，\(-1\)是因为要除去最后一次摆成功的那一次，乘以\(\frac{pl}{pl+pr}\)是根据条件概率公式所得到的。那么向左倒使得期望增加的值就是\(\frac{pl}{1-pl-pr}dp[l]\)，也就是我们求出了向左倒的期望次数，每一次都需要我们重新摆\(dp[l]\)，因此二者相乘。注意，一开始我算成了\(\frac{pl}{1-pl-pr}(dp[l]+1)\)，这是错误的，因为这个\(+1\)所代表的失败其实包含在了\(\frac{1}{1-pl-pr}\)里了。

类似的，向右倒的次数为\(\frac{pr}{1-pl-pr}\)，带来的期望增加为\(\frac{pr}{1-pl-pr}dp[r]\)。

综上，有：

\[dp[i]=dp[l]+dp[r]+\frac{1}{1-pl-pr}+\frac{pr}{1-pl-pr}dp[r]+\frac{pl}{1-pl-pr}dp[l]=\frac{(1-pr)dp[l]+(1-pl)dp[r]+1}{1-pl-pr} \]

进行转移即可，注意枚举的范围不要错（很容易漏掉边界之一，我因为这个wa了两发）。

代码：

#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,n) for(int i=a;i<=n;i++)
#define per(i,a,n) for(int i=n;i>=a;i--)
#define pb push_back
#define SZ(x) ((int)(x).size())
#define fastin ios::sync_with_stdio(0);cin.tie(0);cout.tie(0)
typedef long long ll;
typedef pair<int,int> pii;
typedef double db;
int n;
db pl,pr,dp[1010];
int main(){
	while(scanf("%d",&n)){
		if(!n)	break;
		scanf("%lf%lf",&pl,&pr);
		rep(i,1,n){
			dp[i]=1e15;
		}
		dp[0]=0;dp[1]=1/(1-pl-pr);
		rep(i,2,n){
			rep(l,0,i-1){
				int r=i-(l+1);
				dp[i]=min(dp[i],
					(1-pr)/(1-pl-pr)*dp[l]+(1-pl)/(1-pl-pr)*dp[r]+1/(1-pl-pr));
			}
		}
		printf("%.2f\n",dp[n]);
	}
	return 0;
}

posted @ 2020-07-22 17:31 炸鸡块君阅读(117) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

炸鸡块君

uva 10529 Dumb Bones（概率与期望，期望dp）带公式推导题解

公告