匹配的概率估计
匹配的概率估计
所有人用集合S表示,有个用户群记为A, A是属于S的非空真子集。
已知罪犯a的生日是 \(d_1\),出生城市\(c_1\), 在A中只有用户b的生日和出生地和罪犯a相同,
那么罪犯a就是用户b的概率P是?
分析
- S 表示名字和罪犯a相同的所有用户,假定全国15万, A 表示关注的用户群, 假定5万个。
- 用户出生于\(d_1\)的概率是1/10000
- 出生在城市\(c_1\)的概率是1/1000
- 在A的余集中不出现相同生日和出生地的人概率记为 $ P_0 = (1-P(d_1)P(c_1))^n = (1-1/10000 * 1/1000)^{100000} = 0.99 $
- 在A的余集中出现相同生日和出生地的k人概率记为 $ P_k = C_n^k (1-P(d_1)*P(c_1))^{n-k} (P(d_1)P(c_1))^k \ll P_0 $
- 若$ P_0 > .99 $, 那么 $ P \ge P_0 = 99% $
--- 她说, 她是仙,她不是神