一、简介

贝叶斯用于描述两个条件概率之间的关系,一般,P(A|B)与P(B|A)的结果是不一样的,贝叶斯则是描述P(A|B)和P(B|A)之间的特定的关系。

公式:
\[P({A_{\rm{i}}}|B) = \frac{{P(B|{A_{\rm{i}}})P({A_i})}}{{\sum\limits_{i = 1}^n {P(B|{A_i})P({A_{\rm{i}}})} }}\]

注:\[{A_1},...,{A_n}\]是完备事件组,\[ \cup _{i = 1}^n{A_i} = \Omega ,{A_i}{A_j} = \emptyset ,P({A_i}) > 0\]

 

二、统计学中的应用

贝叶斯分类算法是统计学的一种分类方法

1、朴素贝叶斯(Navie Bayes,NB)

成立前提:各属性之间相互独立,即可以满足完备事件组。

情景:设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i

由于P(X)对于所有的属性来说,P(X)都是一样的,即是一个常数(已知),所以\[P({C_i}|X) \propto P(X|{C_i})P({C_{\rm{i}}})\]

所谓贝叶斯公式,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率.

 

2、TAN算法(Tree Augmented Bayes Network)

TAN算法通过发现属性对之间的依赖关系来降低NB中任意属性之间独立的假设。它是在NB网络结构的基础上增加属性对之间的关联(边)来实现的.

参考:https://blog.csdn.net/qq_26562641/article/details/50343501

 

posted on 2018-11-28 21:47  Bonjour_ing  阅读(2864)  评论(0编辑  收藏  举报