概率统计,生日问题,遍历所有可能求解,穷举法

该图片显示特定人数对应的2个人生日一样的概率

如果你手里只有一把锤子,那么你可能会不自觉地把所有东西都当作钉子来看待。——亚伯拉罕·马斯洛,《科学心理学》(1966)

概率论

概率论是一门涉及面非常广的学科。它的应用相当广泛,既可以应用于纯数学领域,有时也会被一些职业赌徒利用。

我们会频繁讨论如何编写和执行代码来检验我们的计算结果是否正确,或者让我们对答案有一定的认识。如果想在 21世纪的劳动大军中获得竞争优势,那么你必须具备编程和模拟的能力。能够写出一个简单的程序来模拟某个问题的100万种可能情况对我们来说是非常有用的,这些结果通常会提醒你留意那些被遗漏的因素或其他错误。

日常的生活体验已经为你提供了足够的背景知识。我只希望能让你对这门课程有个大体的认识,可以把美妙的数学展现在你眼前,并激励你在接下来的几个月里专注地学好这门课并用好本书。

生日问题(表述3):假设客人的出生日期都是相互独立的,并且每个人都等可能地出生在一年中的任何一天(2月29日除外),那么房间里有多少人才能保证其中至少两个人的生日在同一天的概率不小于50%?

那么该如何着手研究它呢? 最常用的方法是考察一些极端情况,并试着从中找出与答案有关的信息。对我们来说,最坏的情形是所有人的生日都不相同。由于我们假设一年只有365天,因此当有366个人出席聚会时就一定会出现“至少两个人的生日在同一天”的情况 (记住,我们假设没有人出生在2月29日)。

另一种极端情况是,如果只有一个人出席聚会,那么显然不可能有两个人的生日在同一天。因此,答案是在2和365之间的某个数。但到底是多少呢?更深入地思考一下这个问题,我们发现如果有184个人出席聚会,那么至少两个人的生日在同一天的概率应该不小于50%。给出这个判断的原因是:如果其中有183个人的生日互不相同,那么对进入房间的第184个人来说,他与前面183人中的某个人同一天生日的概率就至少为50%。一年中的过半日期已经被占用了!像这样花费几分钟时间来思考问题并从中找到与答案有关的线索通常能为我们带来很大的帮助。只需要简短的几步就能大大缩小答案的范围。我们知道答案就在2和184之间,虽然这仍是一个相当大的范围,但我们觉得答案更接近于2 (想象一下,当有170人出席聚会时将会发生什么)。

我们试着通过穷举法来解答。这是求解概率的第一种方法。不妨设一共有n人出席聚会,而且对每一个人来说,他在任何一天出生的概率都是相等的。我们可以看一看这n个人所有可能的生日排布列表,以及“至少两个人的生日在同一天”的出现频率。不幸的是,当n很大时整个计算过程就是一场噩梦。我们试着考察n取值较小的情况,并从中找到解决问题的线索。

两个人出席

当只有两个人出席聚会时,这两个人所有可能的生日排布方法一共有3652=133225种。为什么?对第一个人来说,他的生日有365种可能,而第二个人的生日也有365种可能。由于两人的出生日期是相互独立的(这是我们的假设前提之一),因此两者所有可能的组合数就等于它们个数的乘积。由两个人生日构成的有序对从(1月1日,1月1日)和(1月1日,1月2日)一直到(12月31日,12月31日)。

在这133225种组合中,两个人生日在同一天的组合只有365种。在这里我们注意到,

  1. 如果两个人的生日在同一天,那么只要选定了第一个人的生日,第二个人的生日就只有唯一一种可能。

因此,对于只有两个人出席的情况,“至少两个人的生日在同一天”的概率是365/3652,约等于0.27%。为了得到这个概率,我们采用的方法是,用成功(两个人的生日在同一天) 的组合数除以所有可能的组合数(生日序对的总个数)。

三个人出席

如果共有三个人出席聚会, 那么所有可能的生日排布方法就有3653=48627125种。

  1. 前两个人的生日在同一天, 且第三个人的生日与他们不同”的生日排布方法共有 365 · 1 · 364 = 132 860 (第一个人的生日可以是一年中的任何一天, 第二个人的生日必须与第一个人相同, 而第三个人的生日一定与前两人不同)。
  2. 第一个人与第三个人的生日在同一天, 且第二个人的生日与他们不同”的生日排布方法共有 132 860
  3. 第二个人与第三个人的生日在同一天, 且第一个人的生日与他们不同”的生日排布方法也有 132 860
  4. 但我们一定要非常小心, 并确保把所有可能的情况都考虑进来. 最后一种可能的情况是这三个人的生日在同一天. 这种情况所对应的生日排布方法共有 365 种。

因此, 这三个人中至少两个人的生日在同一天的概率为 398945/48627125, 约等于 0.82%。这里的 398945 等于132 860 + 132 860 + 132 860 + 365, 它表示“在三个人中, 至少两个人生日在同一天”的生日排布方法数。下面给出 n = 3 时的最后一点说明。检验并查看答案是否合理对我们始终是有好处的。你认为“在只有两个人出席的情况下, 两个人的生日在同一天”的概率更大, 还是“在三个人中, 至少有两个人的生日是在同一天”的概率更大?显然, 总人数越多, “至少两个人的生日在同一天”的概率就越大。因此, 我们要算的概率一定会随着总人数的增多而不断变大, 0.82% 比 0.27% 大也证实了这一点。

四个人出席

当总人数为 4 时, 你会发现我们需要一个更好的计算方法。为什么呢?此时, 我们要考察的情况会更多。它不仅包括“四个人的生日在同一天”“恰有三个人的生日在同一天”以及“恰有两个人的生日在同一天”, 还包括“有两个人的生日在同一天, 且剩下两个人的生日在另外一天”(比如四个人的生日分别是 3 月5 日、3 月 25 日、3 月 25 日和 3 月 5 日)。最后一种情况很好地补充了前面的讨论.之前我们担心重复计算的问题, 现在则会担心漏掉某种可能性!所以, 不仅要避免重复计算, 还必须把所有可能的情况全部考虑进来.好吧, 穷举法不是一个高效、令人满意的方法。我们需要更好的思路。在概率论中, 计算对立事件的概率

本文摘自:《普林斯顿概率论读本》[美]史蒂文·J. 米勒(Steven J. Miller)

本文转载自:https://fermat.me/Blog?title=Probability-and-statistics-birthday-problem-traversal-all-possible-solutions-exhaustive-method

posted on 2022-01-08 13:12  9点0频道  阅读(367)  评论(0编辑  收藏  举报

导航