文本分类

1、提供文本文件

2、将文本文件解析成词条向量（Word2Vec）

3、朴素贝叶斯文本分类，得到p0vec,p1vec,pSpam

4、classifyNB：

用到的函数

文本解析：textParse()

构建词向量（词袋模型）：cteateVocablist()

p0V,p1V,pSpam=trainNB0(trainSet,trainClass)

bool = classifyNB(wordVector,p0V,p1V,pSpam)

posted @ 2017-05-06 18:40 lxwlxw 阅读(177) 评论(0) 收藏举报

刷新页面返回顶部

lxwlxw