【BZOJ-1419】Red is good 概率期望DP

1419: Red is good

Time Limit: 10 Sec  Memory Limit: 64 MB
Submit: 660  Solved: 257
[Submit][Status][Discuss]

Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Source

Solution

概率期望DP

$f[i][j]$表示选$i$张红和$j$张黑的答案

转移就是期望*概率

$f[i][j]=max(0,\frac{i}{i+j}*(f[i-1][j]+1)+\frac{j}{i+j}*(f[i][j-1]-1))$

卡内存需要滚动数组

Code

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
int R,B,now;
double f[2][5001];
int main()
{
    scanf("%d%d",&R,&B);
    for (int i=0; i<=R; i++,now^=1,f[now][0]=i)
        for (int j=1; j<=B; j++)
            f[now][j]=max(0*1.0,1.0*i/(i+j)*(f[now^1][j]+1)+1.0*j/(i+j)*(f[now][j-1]-1));
    long long ans=f[R&1][B]*1000000;
    printf("%lf",(double)ans/1000000);
    return 0;
}
posted @ 2016-09-24 09:25  DaD3zZ  阅读(1580)  评论(1编辑  收藏  举报