Millionaire(2008 APAC local onsites c)

---恢复内容开始---

题意：最开始你有x元钱，要进行M轮赌博。每一轮赢的概率为P，你可以选择赌与不赌，如果赌也可以将所持的任意一部分钱作为赌注（可以是整数，也可以是小数）。如果赢了，赌注将翻倍；输了赌注则没了。在M轮赌博结束后，如果你持有的钱在100万元以上，就可以把这些钱带回家。问：当你采取最优策略时，获得100万元以上的钱并带回家的概率是多少。

类型：动态规划&离散化思想

分析：由于每一轮的赌注是任意的，不一定为整数，因而有无限种可能，所以即便想穷竭搜索也无从着手。但如果能化连续为离散，那么可能便也是有限的了。具体如下：假设前M-1轮的赌博后，还持有x'元。对于最后一轮，考虑的情况有3种。如果x' >= 100万，则没有必要再赌了即最后一轮赢的概率为0；如果50<= x' < 100万，只要参与赌博并且赌注 >= 50万则有赢的概率为P；如果x' < 50万，那么无论是否参与最后一轮的赌博，压的赌注是多少赢的概率必为0。我们不妨看一下倒数第二轮与最后一轮的关系，设在倒数第二轮时持有的钱为x。如果x >= 100万，赢的概率为1；如果x < 25万，即便最后两轮赌博都赢了总钱数必小于100万，所以赢的概率为0；否则，只要选择参与至少一轮赌博并且赌注至少25万则有赢得概率。假设倒数第二轮的赌注为y(y = 0 或 y >= 25万)，则最后一轮持有的钱x' = (x + y)或x' = (x - y)。而倒数第二轮考虑的情况具体可以分为5种。综上，当参与M轮赌博时所需考虑的情况总共有2^m + 1种，可以通过dp解决。定义一个二维dp数组，dp[i][j] := 参与第i轮赌博，持有的钱所在模块为j并且采取最优策略时赢的概率。初始化：dp[n][1 << m] = 1，状态转移方程dp[i][j] = max(P * dp[i + 1][j + k] + (1 - P) * dp[i + 1][j - k] / 0 <= k <= min(j, n - j) )。时间复杂度O(m*2^2m)。

//代码实现：已通过滚动数组循环利用完成空间复杂度的优化

#include <iostream>
#include <memory.h>
#include <algorithm>
#include <cstdio>
using namespace std;

int M , X;
double P;
double dp[2][(1 << 15) + 1];

void solve()
{
　　 int n = 1 << M;
    　double *pre = dp[0] , *nxt = dp[1];
　　memset(pre , 0 , sizeof(double) * (n + 1));
　　pre[n] = 1.0;//因：模块n对应的资金>= 100万
    　for(int r = 0 ; r < M; r++)
     {
  　　　for(int i = 0 ; i <= n ; i++)
  　　 {
            int step = min(i , n - i);//避免i + j > n
            double t = 0.0;

   　　   for(int j = 0 ; j <= step ; j++)
    　　　　t = max(t , P * pre[i + j] + (1 - P) * pre[i - j]);//进行m轮赌博,最小赌资应为 100万/n
  　　   nxt[i] = t;//以模块i的资金进行r + 1轮赌博,赢的最大概率
  　　　}
  　　 swap(pre , nxt);
　　}
　　int i = X * n / 1000000;//资金X所在模块
　　printf("%.6lf\n" , pre[i]);
}

int main()
{
　　cin >> M >> P >> X;
　　solve();
　　 return 0;
}

---恢复内容结束---

发表于 2015-08-07 23:09 gjunyan 阅读(681) 评论(0) 编辑收藏举报

公告