文本分类

1、提供文本文件

2、将文本文件解析成词条向量(Word2Vec)

3、朴素贝叶斯文本分类,得到p0vec,p1vec,pSpam

4、classifyNB:

用到的函数

文本解析:textParse()

构建词向量(词袋模型):cteateVocablist()

p0V,p1V,pSpam=trainNB0(trainSet,trainClass)

bool = classifyNB(wordVector,p0V,p1V,pSpam)

 

posted @ 2017-05-06 18:40  lxwlxw  阅读(167)  评论(0编辑  收藏  举报