条件概率

search(诊断试验中的贝叶斯定理:检验阳性就一定患病了吗?); search(Bayes' rules, Conditional probability, Chain rule)

10天的统计表:
  天 1 2 3 4 5 6 7 8 9 10
乌云 c c   c   c     c    Cloud
下雨 r   r r   r r   r    Rain
花猫       mmm m m   m    Missing
白猫 m   m m   m m   m    Missing

乌云密布和下雨是事件。C代表count,C(乌云)=5, C(下雨)=C(花猫不见了)=C(白不见)=6。

条件概率是事件B在事件A已经发生条件下的发生概率,记作P(B|A),读作在A的条件下B的概率。下面我们用P(A-B)代表P(B|A),注意左右颠倒和上下翻转-|。

P(花不见-下雨)=C(花不见and下雨)/C(下雨)=4/6; P(白不见-下雨)=1; P(花不见-下雨) 不等于 C(花不见)/C(下雨)。

P(花不见-下雨)=P(花不见and下雨)/P(下雨),即分子分母同除以n。

P(A-B)=P(AB)/P(A), P(AB)=P(A)*P(A-B). AB是A and B的缩写。这里的and指的是一起出现,不是0 and 1 = 0这样的布尔代数/逻辑运算。

P(白不见-下雨)=1说明什么?我们找到下雨的原因了?我们只能说:根据现有的数据,如果白猫不见了则下雨的概率高达100%,其原因可能是:a. 白猫躲起来施法去了; b. 白猫老寒腿能预测下雨提前躲起来了; c. 碰巧或其它。

P(B)*P(B-A) = P(AB) = P(A)*P(A-B). 如果下雨则白猫不见了的概率也是1。概率只报告现象,不研究原因。不过这个原因可能就躲雨俩字。也许基于概率的系统虽能work,但我们和它都不知道它如何work.

Conditional probability is the probability of an event occurring given that another event has already occurred. "条件": a. 影响事物存在或发展的因素; b.具备或处于的状况

The distributive, associative and De Morgans laws are valid for probability calculation too. Generalizing the product rule leads to the chain rule.

P(XYZ)=P(XY)*P(XY-Z)=P(X)*P(X-Y)*P(XY-Z) X发生了,X发生后Y发生了,X发生后Y发生后,XYZ eventually发生了。

三门问题可以不用链式法则。用的话是种简洁的啰嗦:不断重复运用简单明确的规则,一二三,万物生。:-)

不妨设奖品固定在0号门,但你不知道,还是随便选。P(012)表示你选0,主持人选1,你选2。P(??0)是中奖的概率,它是若干个概率的和。P(001)不合法,P(012)和P(021)中奖概率是0,P(120)=x,中奖。x用链式法则算,如P(120)=1/3 * 1 * 1 = 1/3 = P(210). tri-gram is better than bi-gram. 有点像#字棋。算完这个再算一个呗:

# -*- coding: gbk -*-
from random import randint
def r(): return randint(0, 2)
cnt = 0; n = 1500000; bag = [0, 1, 0]
for i in range(n): if bag[r()] or bag[r()]: cnt += 1
print(float(cnt) / n, 5.0 / 9)
# 0.5556346666666667 0.5555555555555556
# 我只imply了5/9,所以hopefully, 我不必再回来改帖子了。 :-)

好像是1/3 + (2/3)*(1/3). 当面试题够格不?如"不许运行看出这个程序的输出"。

在"患病"例子里,P(阳性-患病)是我们关心的,又是未知的。它可以通过已知的P(患病-阳性)和其它概率算出来。阳性是判断患病的指标之一,还有别的判断方法。检验单为啥不直接印上P(阳性-患病)? 挂号费50,一天看10个病人,一个月1万5不算房租水电。医生要读很多年很难的书。做游戏也不简单,也不是个个挣大钱。

坐飞机时有一个人带炸弹的概率是万分之一。如果我坐时带个炸弹,那么有两个人带炸弹的概率是亿分之一。所以我带个安全得多(当然带而不用)。笑点何在?似乎概率关心的是群体大数,to infinity. 我觉得用计数来计算概率, m/n, m>=30, n>=1000,得出的结果才可信。对于个体而言,小概率事件是可能发生的,如自己不带炸弹,头一次坐飞机,就遇上俩带的。某些论文把n=30叫做大样本,不过研究病/死时,n很大是伦理错误甚至反人类的。新药给谁吃不给谁吃咋决定?不对比研究怎么判断新药的有效性?

n-gram - Fun_with_Words - 博客园 (cnblogs.com)

posted @ 2021-12-05 14:21  Fun_with_Words  阅读(384)  评论(0编辑  收藏  举报









 张牌。