2016级算法第五次上机-D.AlvinZH的学霸养成记III

850 AlvinZH的学霸养成记III

思路

难题。概率DP。

第一种思考方式：直接DP

dp[i]：从已经有i个学霸到所有人变成学霸的期望。

那么答案为dp[1]，需要从后往前逆推。对于某一天，有可能会增加一个学霸or不增加。

①增加：\((dp[i+1] + 1) * P\)

②不增加：\((dp[i] + 1) * (1-P)\)

其中，\(P = i * (n - i) * p / (C(n,2))\)，C(n,2) = (n - 1) * n / 2。其含义是：n个人中选出一非学霸一学霸的方法数/n个人中选出两人方法数。

状态转移方程：\(dp[i] = (dp[i + 1] + 1) * P + (dp[i] + 1) * (1 - P)\)。移项化简后可得： \(dp[i] = dp[i + 1] + 1 / P\) 。

其实可能正着想更简单，令dp[i]表示达到班内有i个学霸的期望天数。则有dp[1] = 0。相同的分析分发，最后依然可以得到 \(dp2[i] = dp[i-1] + 1/P\) 。最后答案为dp[n]。

优化一下，完全不需要这个dp数组，使用一个变量累加即可得到答案。

第二种思考方式：期望叠加

每天至多有一个人转化为学霸，考虑第i个人转化为学霸的期望天数D[i]，那么所有人转化为学霸的期望天数 \(ans=D[1]+D[2]+…+D[n-1]\)。

设第i个人转化为学霸的概率为p[i]，则第i个人转化为学霸服从几何分布。

几何分布：在n次伯努利试验中，试验k次才得到第一次成功的机率。详细地说，是：前k-1次皆失败，第k次成功的概率。

期望\(EX=1*a+2*(1-a)*a+3*(1-a)^2*a+...\) ，错位相减求和即可得期望为 \(1/p[i]\)。

故 \(D[i]=1/p[i]\) ，而 \(p[i]=p*i*(n-i)/(n*(n-1)/2)\)，所以 \(D[i]=n*(n-1)/(2*p*i*(n-i))\) ，那么我们就可以在O(n)的时间内得到ans值.

你可能已经发现，最后二者计算方法其实一模一样的，侧面证明答案正确。

分析

两种方法时间复杂度都为O(n)。

需要注意的问题是乘法溢出问题，在计算 \(n*(n-1) / (2*p*i*(n-i))\) 的过程中，有两个地方会溢出，一个是n(n-1)，你可以通过(double)n(n-1)防止溢出，注意(double)(n(n-1))没有效果；第二个溢出是2i(n-i)p，你可以把p放前面先计算或者把i强制转换为浮点数防止溢出。

参考资料：有关概率和期望问题的研究

参考代码一

//
// Created by AlvinZH on 2017/9/15.
// Copyright (c) AlvinZH. All rights reserved.
//

#include <cstdio>
#include <cstring>
#include <cstdlib>
#define MaxSize 100005

double dp[MaxSize];//dp[i]表示学霸数量为i时，到达目标的期望

int main()
{
    int T, n;
    double p, ans1, ans2, p1;
    scanf("%d", &T);
    while (T--)
    {
        scanf("%d%lf", &n, &p);
        dp[n] = 0;

        for (int i = n-1; i > 0; i--)
        {
            ans1 = (double)i * (n-i);//选出一非学霸和一学霸
            ans2 = (double)n * (n-1) / 2;//从n个人中选两个人

            p1 = ans1 / ans2 * p;
            dp[i] = dp[i+1] + 1.0/p1;
        }
        printf("%.3lf\n",dp[1]);
    }
    return 0;
}

参考代码二

//
// Created by AlvinZH on 2017/9/15.
// Copyright (c) AlvinZH. All rights reserved.
//

#include<cstdio>

int main()
{
    int T, n;
    double p, ans;
    scanf("%d", &T);
    while (T--)
    {
        scanf("%d %lf", &n, &p);
        ans = 0.0;
        for(int i = 1; i < n; i++)
            ans += 1.0 * n* (n-1) / (2 * p * i * (n-i));
        printf("%.3lf\n", ans);
    }
    return 0;
}

posted @ 2017-12-15 23:09 AlvinZH 阅读(406) 评论(0) 收藏举报

刷新页面返回顶部

AlvinZH

有多少事情，是你我都不知道的呢？

2016级算法第五次上机-D.AlvinZH的学霸养成记III

850 AlvinZH的学霸养成记III

思路

分析

参考代码一

参考代码二

公告