匹配的概率估计

匹配的概率估计

所有人用集合S表示,有个用户群记为A, A是属于S的非空真子集。
已知罪犯a的生日是 \(d_1\),出生城市\(c_1\), 在A中只有用户b的生日和出生地和罪犯a相同,
那么罪犯a就是用户b的概率P是?

分析

  • S 表示名字和罪犯a相同的所有用户,假定全国15万, A 表示关注的用户群, 假定5万个。
    • 用户出生于\(d_1\)的概率是1/10000
    • 出生在城市\(c_1\)的概率是1/1000
  • 在A的余集中不出现相同生日和出生地的人概率记为 $ P_0 = (1-P(d_1)P(c_1))^n = (1-1/10000 * 1/1000)^{100000} = 0.99 $
  • 在A的余集中出现相同生日和出生地的k人概率记为 $ P_k = C_n^k (1-P(d_1)*P(c_1))^{n-k} (P(d_1)P(c_1))^k \ll P_0 $
  • 若$ P_0 > .99 $, 那么 $ P \ge P_0 = 99% $
posted @ 2015-09-18 00:05  bregman  阅读(335)  评论(0编辑  收藏  举报