条件概率

search(诊断试验中的贝叶斯定理：检验阳性就一定患病了吗？); search(Bayes' rules, Conditional probability, Chain rule)

10天的统计表：
  天 1 2 3 4 5 6 7 8 9 10
乌云 c c   c   c     c    Cloud
下雨 r   r r   r r   r    Rain
花猫       mmm m m   m    Missing
白猫 m   m m   m m   m    Missing

乌云密布和下雨是事件。C代表count，C(乌云)=5, C(下雨)=C(花猫不见了)=C(白不见)=6。

条件概率是事件B在事件A已经发生条件下的发生概率，记作P(B|A)，读作在A的条件下B的概率。下面我们用P(A-B)代表P(B|A)，注意左右颠倒和上下翻转-|。

P(花不见-下雨)=C(花不见and下雨)/C(下雨)=4/6; P(白不见-下雨)=1; P(花不见-下雨) 不等于 C(花不见)/C(下雨)。

P(花不见-下雨)=P(花不见and下雨)/P(下雨)，即分子分母同除以n。

P(A-B)=P(AB)/P(A), P(AB)=P(A)*P(A-B). AB是A and B的缩写。这里的and指的是一起出现，不是0 and 1 = 0这样的布尔代数/逻辑运算。

P(白不见-下雨)=1说明什么？我们找到下雨的原因了？我们只能说：根据现有的数据，如果白猫不见了则下雨的概率高达100%，其原因可能是：a. 白猫躲起来施法去了; b. 白猫老寒腿能预测下雨提前躲起来了; c. 碰巧或其它。

P(B)*P(B-A) = P(AB) = P(A)*P(A-B). 如果下雨则白猫不见了的概率也是1。概率只报告现象，不研究原因。不过这个原因可能就躲雨俩字。也许基于概率的系统虽能work，但我们和它都不知道它如何work.

Conditional probability is the probability of an event occurring given that another event has already occurred. "条件": a. 影响事物存在或发展的因素; b.具备或处于的状况

The distributive, associative and De Morgans laws are valid for probability calculation too. Generalizing the product rule leads to the chain rule.

P(XYZ)=P(XY)*P(XY-Z)=P(X)*P(X-Y)*P(XY-Z) X发生了，X发生后Y发生了，X发生后Y发生后，XYZ eventually发生了。

三门问题可以不用链式法则。用的话是种简洁的啰嗦：不断重复运用简单明确的规则，一二三，万物生。:-)

不妨设奖品固定在0号门，但你不知道，还是随便选。P(012)表示你选0，主持人选1，你选2。P(??0)是中奖的概率，它是若干个概率的和。P(001)不合法，P(012)和P(021)中奖概率是0，P(120)=x，中奖。x用链式法则算，如P(120)=1/3 * 1 * 1 = 1/3 = P(210). tri-gram is better than bi-gram. 有点像#字棋。算完这个再算一个呗：

# -*- coding: gbk -*-
from random import randint
def r(): return randint(0, 2)
cnt = 0; n = 1500000; bag = [0, 1, 0]
for i in range(n): if bag[r()] or bag[r()]: cnt += 1
print(float(cnt) / n, 5.0 / 9)
# 0.5556346666666667 0.5555555555555556
# 我只imply了5/9，所以hopefully, 我不必再回来改帖子了。 :-)

好像是1/3 + (2/3)*(1/3). 当面试题够格不？如"不许运行看出这个程序的输出"。

在"患病"例子里，P(阳性-患病)是我们关心的，又是未知的。它可以通过已知的P(患病-阳性)和其它概率算出来。阳性是判断患病的指标之一，还有别的判断方法。检验单为啥不直接印上P(阳性-患病)? 挂号费50，一天看10个病人，一个月1万5不算房租水电。医生要读很多年很难的书。做游戏也不简单，也不是个个挣大钱。

坐飞机时有一个人带炸弹的概率是万分之一。如果我坐时带个炸弹，那么有两个人带炸弹的概率是亿分之一。所以我带个安全得多(当然带而不用)。笑点何在？似乎概率关心的是群体大数，to infinity. 我觉得用计数来计算概率, m/n, m>=30, n>=1000，得出的结果才可信。对于个体而言，小概率事件是可能发生的，如自己不带炸弹，头一次坐飞机，就遇上俩带的。某些论文把n=30叫做大样本，不过研究病/死时，n很大是伦理错误甚至反人类的。新药给谁吃不给谁吃咋决定？不对比研究怎么判断新药的有效性？

n-gram - Fun_with_Words - 博客园 (cnblogs.com)

posted @ 2021-12-05 14:21 华容道专家阅读(421) 评论(0) 收藏举报

刷新页面返回顶部

Penilum meum pullo sententia Latin a est 「通过浪费时间获得快乐」

条件概率