一个有意思的悖论:生日悖论

假设一年有 \(N\) 天,不考虑润年的 \(2/29\) 。假设有 \(K \ (K \leq N)\) 个人的生日是随机分布。

\(\mathcal{P}(K)\) 是前 \(K\) 个人中没有人生日相同的概率。这是一个有限概率问题,可以转化为组合方案数:

样本空间是 \(K\) 个人都有 \(N\) 种可能的生日,总可能的方案是 \(N^{K}\)

\(N\) 天中,\(K\) 个人生日不同的方案是 \(N\)\(K\) 排列 \(P_{N}^{K} = \prod_{i = 0}^{K} N - i\)

于是概率为:

\[\mathcal{P}(K) = \frac{\prod_{i = 0}^{K} N - i}{365^{K}} = \prod_{i = 0}^{K} \frac{N - i}{N} \]

存在两个人生日相同的概率为:

\[\overline{\mathcal{P}}(K) = 1 - \mathcal{P}(K) = 1 - \prod_{i = 0}^{K} \frac{N - i}{N} \]

使用一个经典放缩式:

\[1 + x \leq e^{x} = exp(x) \]

\(exp(x)\)\(e^{x}\) 的另一种写法)

\[\begin{aligned} \mathcal{P}(K) &= \prod_{i = 0}^{K} \frac{N - i}{N} \\ &= \prod_{i = 0}^{K} 1 + \frac{- i}{N} \\ &\leq \prod_{i = 0}^{K} exp(\frac{- i}{N}) \\ &= exp(\sum_{i = 0}^{K} \frac{- i}{N}) \\ &= exp(- \frac{\sum_{i = 0}^{K} i}{N}) \\ &= exp(- \frac{\binom{K + 1}{2}}{N}) \\ &= exp(- \frac{(K + 1)K}{2 N}) \\ \end{aligned} \]

\[F(K) = exp(- \frac{(K + 1)K}{2 N}) = e^{- \frac{(K + 1)K}{2 N}} \]

\[F(K)^{'} = \frac{\Delta F(K)}{\Delta K} = \frac{\Delta exp(- \frac{(K + 1)K}{2 N})}{\Delta x} = -exp(- \frac{(K + 1)K}{2 N}) \]

恒为负数。
于是 \(F(K)\) 是单调递减函数。

接下来是一些有趣的例子

\(N = 365\)

\(F(24) > \frac{1}{2} > F(23)\) ,则 \(\mathcal{P}(26) \leq F(23) < \frac{1}{2}\) ,有 \(\overline{\mathcal{P}}(23) = 1 - \mathcal{P}(23) > \frac{1}{2}\)

于是得到了生日悖论的基础形式:不考虑 \(2\)\(29\) 日的情况下,随机 \(23\) 个人中,生日同一天的概率大于 \(50 \%\)

更进一步地,由 \(F(57) > \frac{99}{100} > F(56)\) ,则 \(\mathcal{P}(56) \leq F(56) < \frac{99}{100}\) ,有 \(\overline{\mathcal{P}}(56) = 1 - \mathcal{P}(56) > \frac{99}{100}\)
可以得到了生日悖论的扩展形式:不考虑 \(2\)\(29\) 日的情况下,随机 \(56\) 个人中,存在两个人生日是同一天的概率大于 \(99 \%\)
另一个断言(伪的断言)是:一个 \(\geq 56\) 人的普通教学班中,一定存在两个人的生日是同一天。

最后是实用性的技巧
\(P\) 个位置中给 \(n\) 个位置随机,不存在冲突的概率为:

\[e^{- \frac{n(n - 1)}{P}} \]

这个性质在算法问题中非常实用。

posted @ 2024-07-28 15:25  zsxuan  阅读(202)  评论(0编辑  收藏  举报