垃圾邮件识别问题,也即对给定样本(包含垃圾邮件,非垃圾邮件)判断是否为垃圾邮件,根据贝叶斯定理:
然后根据朴素贝叶斯的属性间的独立性假设可进一步分解为:
对 p(xi|y=1) 根据贝叶斯公式,又可得:
便可将全部不易计算的概率转化为容易计算的形式。