条件概率,全概率公式,贝叶斯公式,朴素贝叶斯

本文摘自黄清龙等编著的《概率论与数理统计》

-----------------------------------------------------------------------------------------------------------

条件概率

-----------------------------------------------------------------------------------------------------------

全概率公式

 

-----------------------------------------------------------------------------------------------------------

贝叶斯公式

-----------------------------------------------------------------------------------------------------------

朴素贝叶斯

我们以一个例子来阐述朴素贝叶斯思想。例子来朴素贝叶斯分类:原理

假设根据以前的经验获得如下的数据。然后给你一个新的数据:身高“高”、体重“中”,鞋码“中”,请问这个人是男还是女?

判断是男还是女,是分类问题,记男为C1,女为C2。身高体重鞋码是样本X的属性,记x1为身高,x2为体重,x3为鞋码。我们问题是,已知样本X的属性,求它最有可能属于哪一类。也就是说朴素贝叶斯分类法预测X属于Ci类,当且仅当

P(Ci|X)>P(Cj|X),1<= j <=2,j!=i

这样,最大化P(Ci|X)。P(Ci|X)叫做Ci的后验概率(posterior probability)。X先发生,Ci后发生,我们关注的是Ci的概率,所以把P(Ci|X)叫做Ci的后验概率。使P(Ci|X)最大的类Ci称为最大后验假设。根据贝叶斯公式:

由于P(X)对于所有类为常数,所以只需要P(X|Ci)P(Ci)最大即可。

打断一下,其实在这里,贝叶斯公式可以这样理解:

回到正题,现在我们需要计算的一项是P(X|Ci),但是包含三个属性,每个属性的size是3,总共是9维空间。这还是简化之后的情况,现实生活中的情况属性和维数会更高很多,这将使得计算P(X|Ci)变得很困难,因此有了朴素贝叶斯假设:属性之间相互独立,即P(X|Ci)=P(x1|Ci)·P(x2|Ci)·P(x3|Ci)。关于朴素贝叶斯假设可参考带你理解朴素贝叶斯分类算法,这篇文章讲的很详细。

在本例中,新的样本的属性是x1=高,x2=中,x3=中。

P(x1|C1)=0.5,P(x2|C1)=0.5,P(x3|C1)=0.25,P(C1)=0.5,---> P(X|C1)P(C1)=0.5*0.5*0.25*0.5=0.03125

  P(x1|C2)=0,P(x2|C2)=0.5,P(x3|C2)=0.5,P(C2)=0.5,---> P(X|C1)P(C1)=0*0.5*0.5*0.5=0

所以新样本更可能属于C1类,即男生。

总结朴素贝叶斯计算过程:

(截图摘自带你理解朴素贝叶斯分类算法)

 

posted @ 2020-09-06 09:59  Picassooo  阅读(836)  评论(0编辑  收藏  举报