摘要:
一. 概率论基础1. 条件概率公式:2. 全概率公式:3. 由条件概率公式和全概率公式可以导出贝叶斯公式二. 文本分类要计算一篇文章D所属的类别c(D),相当于计算生成D的可能性最大的类别,即:其中P(D)与C无关,故三. 朴素贝叶斯分类模型朴素贝叶斯假设:在给定类别C的条件下,所有属性Di相互独立,即,根据朴素贝叶斯假设,可得其中, :类别c中的训练文本数 :总训练文本数 :单词di在类别c中出现的次数综上可得,四. 具体代码(源代码)程序采用java语言进行编写,运用搜狗语料库进行训练。具体程序代码如下:Main.java——主程序,负责读取待分类文章以及调用分类器package clas 阅读全文