XJOI 3870 游戏的期望
题意
有一个游戏平板上面有\(n* m\)个格子,一开始每个格子都是关闭的,每个格子里面都有一个标记
已知每种标记恰好出现两次,也就是一共有\(n∗ m/2\)种标记
规定一次移动为依次(one by one不是同时)打开一对格子查看里面的标记,如果标记不一样,格子会自动关闭,但是你的记忆是超强了,看过了就不会忘,如果标记是一样的,格子从此就一直保持打开状态,当所有格子都打开时游戏结束
请算出游戏结束的最少期望步数
输入格式
输入一行包含两个整数\(N,M (1≤N≤50,1≤M≤50)\)
\(N∗ M\)是偶数
输出格式
输出一个浮点数.误差不超过\(1e−9\)
样例1
1 2
1.0
样例2
2 2
2.6666666666666665
样例3
2 3
4.333333333333334
样例4
4 4
12.392984792984793
分析
这是一道期望dp(概率dp)题。
设 \(dp[i][j]\) 表示还有 \(i+j\) 张牌未匹配,已翻开 \(i\) 张,未翻开 \(j\) 张。
状态转移分类讨论:
从剩下 \(j\) 张牌中选择一张 \(A\),
1.恰好与已翻开的i张中的一张 \(B\) 匹配,则翻开 \(B\);
2.未与已翻开的匹配,则再随机翻一张 \(B\) ,
(1) \(A,B\) 刚好匹配;
(2) \(A,B\)不匹配,也没有与已翻开的匹配;
(3) \(B\) 与已翻开的 \(i\) 张中的一张 \(C\) 匹配,则在下一轮中翻开 \(B,C\) 。
转移方程:
设 \(p\) 为1.情况的概率, \(b\) 为2.(1)情况概率, \(c\) 为2.(2)情况概率, \(d\) 为2.(3)情况概率,有$$dp[i][j]=p(1+dp[i-1][j-1])+(1-p)(b(1+dp[i][j-2])+c(1+dp[i+2][j-2])+d*(2+dp[i][j-2]))$$
另外,注意精度问题
Code
#include<cstdio>
#define maxn 2502
using namespace std;
double dp[maxn][maxn];
//期望dp是倒推的
int main(){
int n,m;
scanf("%d%d",&n,&m);
n*=m;
for(int j=0;j<=n;j++){
for(int i=0;i<=n;i++){
if((!i&&!j)||(i>j)||(i+j>n)||((j-i)&1))continue;
double p=double(i)/j;
//p:从剩下j张未翻开的牌中选择一张A,恰好与已翻开的i张中的一张B匹配,则翻开B
if(j&&i){
dp[i][j]+=p*(1+dp[i-1][j-1]);
}
if(j>=2){
double b=1./(j-1),c=double(j-i-2)/(j-1),d=1-b-c;
//b:从剩下j张未翻开的牌中选择一张A,未匹配,再随机翻一张B,A,B刚好匹配
//c:从剩下j张未翻开的牌中选择一张A,未匹配,再随机翻一张B,无任何匹配
//d:从剩下j张未翻开的牌中选择一张A,未匹配,再随机翻一张B,B与已翻开的i张中的一张C匹配,则在下一轮中翻开B,C
dp[i][j]+=(1-p)*(b*(1+dp[i][j-2])+c*(1+dp[i+2][j-2])+d*(2+dp[i][j-2]));
}
}
}
printf("%.11lf",dp[0][n]);
return 0;
}