基于贝叶斯理论的分类方法
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
贝叶斯决策理论的核心思想就是选择具有最高概率的决策。
条件概率
已知条件下的概率,在书中是以取灰白石头为例。
已知条件为A,发生B的概率为
P(B|A)=P(B and A)/P(A)
已知P(x|c),要求P(c|x),那么计算方法如下:
p(c|x)=p(x|c)*p(c)/p(x)
朴素贝叶斯分类器通常有两种实现方式:一种基于贝努利模型,一种基于多项式模型。
==========================================================
以前都是无脑抄书上的,根本就没有理解贝叶斯理论,最近又再看<<think bayes>>,虽然只看完第一章,但知道懂了为什么公式是这样推出来的了。
P(A and B) = P(A) * P(B) 这个公式是在A,B事件相互独立的时候成立
如果A、B事件不是相互独立的,则公式就是这样的
P(A and B) = P(A) * P(B|A)
或者
P(B and A) = P(B) * P(A|B)
因为P(A and B) = P(B and A)
所以才能推出上面的公式