[ BZOJ 1419 ] Red is Good
\(\\\)
Description
桌面上有 \(R\) 张红牌和 \(B\) 张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌。
翻到红牌得到 \(1\$\),黑牌则付出\(1\$\)。可以随时停止翻牌,在最优策略下平均能得到多少钱。
- \(R,B\le 5000\)
\(\\\)
Solution
期望水题。
所谓最优策略也就是不会使得得到的钱为负数,转移的时候和 \(0\) 取 \(max\) 就是了。
注意,由于是牌序随机,所以最后答案必须是全部牌的得分期望。
设 \(f[i][j]\) 表示拿了 \(i\) 张红牌, \(j\) 张黑牌的期望得钱数。
\[f[i][j]=max\bigg(0,\frac i{(i+j)}\times(f[i-1][j]+1)+\frac{j}{(i+j)}\times (f[i][j-1]-1))\bigg)
\]
\(\\\)
Code
#include<cmath>
#include<cstdio>
#include<cctype>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
#define N 5010
#define R register
#define gc getchar
using namespace std;
typedef long long ll;
int n,m;
double f[2][N];
int main(){
scanf("%d%d",&n,&m);
for(R int i=0,now=0;i<=n;++i,now^=1,f[now][0]=(double)i){
for(R int j=1;j<=m;++j)
f[now][j]=max(0.0,(double)i/(double)(i+j)*(f[now^1][j]+1)+(double)j/(double)(i+j)*(f[now][j-1]-1));
}
ll ans=f[n&1][m]*1000000;
printf("%lf",(double)ans/1000000);
return 0;
}