【模式识别与机器学习】——2.1贝叶斯判别法

Posted on 2018-09-17 16:30 Charlie_ODD 阅读(8657) 评论(0) 编辑收藏举报

一.作为统计判别问题的模式分类

　　模式识别的目的就是要确定某一个给定的模式样本属于哪一类。可以通过对被识别对象的多次观察和测量，构成特征向量，并将其作为某一个判决规则的输入，按此规则来对样本进行分类。在获取模式的观测值时，有些事物具有确定的因果关系，即在一定的条件下，它必然会发生或必然不发生。但在现实世界中，由许多客观现象的发生，就每一次观察和测量来说，即使在基本条件保持不变的情况下也具有不确定性。只有在大量重复的观察下，其结果才能呈现出某种规律性，即对它们观察到的特征具有统计特性。特征值不再是一个确定的向量，而是一个随机向量。此时，只能利用模式集的统计特性来分类，以使分类器发生错误的概率最小。

二.贝叶斯判别原则

2.1 两类模式集的分类

目的：要确定x是属于ω1类还是ω2类，要看x是来自于ω1类的概率大还是来自ω2类的概率大。

2.2 贝叶斯判别规则

对于自然属性是属于ωi类的模式x来说，它来自ωi类的概率应为P(ωi |x)

根据概率判别规则，有：

由贝叶斯定理，后验概率P(ω_i| x)可由类别ω_i的先验概率P(ω_i)和x的条件概率密度p(x | ω_i)来计算，即：

这里p(x | ω_i)也称为似然函数。将该式代入上述判别式，有：

或

其中，l₁₂称为似然比，P(ω₂)/P(ω₁)=θ₂₁称为似然比的判决阈值，此判别称为贝叶斯判别。

2.3 贝叶斯判别示例

问题描述：

　　对某一地震高发区进行统计，地震以ω1类表示，正常以ω2类表示统计的时间区间内，每周发生地震的概率为20%，即P(ω1)=0.2，当然P(ω2)=1-0.2=0.8 在任意一周，要判断该地区是否会有地震发生。显然，因为P(ω2)> P(ω1)，只能说是正常的可能性大。如要进行判断，只能其它观察现象来实现。通常地震与生物异常反应之间有一定的联系。

　　若用生物是否有异常反应这一观察现象来对地震进行预测，生物是否异常这一结果以模式x代表，这里x为一维特征，且只有x=“异常”和x=“正常”两种结果。假设根据观测记录，发现这种方法有以下统计结果：

地震前一周内出现生物异常反应的概率=0.6，即p(x=异常| ω1)=0.6

地震前一周内出现生物正常反应的概率=0.4，即p(x=正常| ω1)=0.4

一周内没有发生地震但也出现了生物异常的概率=0.1，即p(x=异常| ω2)=0.1

一周内没有发生地震时，生物正常的概率=0.9，即p(x=正常| ω2)=0.9

　　若某日观察到明显的生物异常反应现象，一周内发生地震的概率为多少，即求P(ω1 | x=异常)=？

解决过程：