条件概率
search(诊断试验中的贝叶斯定理:检验阳性就一定患病了吗?); search(Bayes' rules, Conditional probability, Chain rule)
10天的统计表: 天 1 2 3 4 5 6 7 8 9 10 乌云 c c c c c Cloud 下雨 r r r r r r Rain 花猫 mmm m m m Missing 白猫 m m m m m m Missing
乌云密布和下雨是事件。C代表count,C(乌云)=5, C(下雨)=C(花猫不见了)=C(白不见)=6。
条件概率是事件B在事件A已经发生条件下的发生概率,记作P(B|A),读作在A的条件下B的概率。下面我们用P(A-B)代表P(B|A),注意左右颠倒和上下翻转-|。
P(花不见-下雨)=C(花不见and下雨)/C(下雨)=4/6; P(白不见-下雨)=1; P(花不见-下雨) 不等于 C(花不见)/C(下雨)。
P(花不见-下雨)=P(花不见and下雨)/P(下雨),即分子分母同除以n。
P(A-B)=P(AB)/P(A), P(AB)=P(A)*P(A-B). AB是A and B的缩写。这里的and指的是一起出现,不是0 and 1 = 0这样的布尔代数/逻辑运算。
P(白不见-下雨)=1说明什么?我们找到下雨的原因了?我们只能说:根据现有的数据,如果白猫不见了则下雨的概率高达100%,其原因可能是:a. 白猫躲起来施法去了; b. 白猫老寒腿能预测下雨提前躲起来了; c. 碰巧或其它。
P(B)*P(B-A) = P(AB) = P(A)*P(A-B). 如果下雨则白猫不见了的概率也是1。概率只报告现象,不研究原因。不过这个原因可能就躲雨俩字。也许基于概率的系统虽能work,但我们和它都不知道它如何work.
Conditional probability is the probability of an event occurring given that another event has already occurred. "条件": a. 影响事物存在或发展的因素; b.具备或处于的状况
The distributive, associative and De Morgans laws are valid for probability calculation too. Generalizing the product rule leads to the chain rule.
P(XYZ)=P(XY)*P(XY-Z)=P(X)*P(X-Y)*P(XY-Z) X发生了,X发生后Y发生了,X发生后Y发生后,XYZ eventually发生了。
三门问题可以不用链式法则。用的话是种简洁的啰嗦:不断重复运用简单明确的规则,一二三,万物生。:-)
不妨设奖品固定在0号门,但你不知道,还是随便选。P(012)表示你选0,主持人选1,你选2。P(??0)是中奖的概率,它是若干个概率的和。P(001)不合法,P(012)和P(021)中奖概率是0,P(120)=x,中奖。x用链式法则算,如P(120)=1/3 * 1 * 1 = 1/3 = P(210). tri-gram is better than bi-gram. 有点像#字棋。算完这个再算一个呗:
# -*- coding: gbk -*- from random import randint def r(): return randint(0, 2) cnt = 0; n = 1500000; bag = [0, 1, 0] for i in range(n): if bag[r()] or bag[r()]: cnt += 1 print(float(cnt) / n, 5.0 / 9) # 0.5556346666666667 0.5555555555555556 # 我只imply了5/9,所以hopefully, 我不必再回来改帖子了。 :-)
好像是1/3 + (2/3)*(1/3). 当面试题够格不?如"不许运行看出这个程序的输出"。
在"患病"例子里,P(阳性-患病)是我们关心的,又是未知的。它可以通过已知的P(患病-阳性)和其它概率算出来。阳性是判断患病的指标之一,还有别的判断方法。检验单为啥不直接印上P(阳性-患病)? 挂号费50,一天看10个病人,一个月1万5不算房租水电。医生要读很多年很难的书。做游戏也不简单,也不是个个挣大钱。
坐飞机时有一个人带炸弹的概率是万分之一。如果我坐时带个炸弹,那么有两个人带炸弹的概率是亿分之一。所以我带个安全得多(当然带而不用)。笑点何在?似乎概率关心的是群体大数,to infinity. 我觉得用计数来计算概率, m/n, m>=30, n>=1000,得出的结果才可信。对于个体而言,小概率事件是可能发生的,如自己不带炸弹,头一次坐飞机,就遇上俩带的。某些论文把n=30叫做大样本,不过研究病/死时,n很大是伦理错误甚至反人类的。新药给谁吃不给谁吃咋决定?不对比研究怎么判断新药的有效性?