基于朴素贝叶斯分类器的文本分类算法C#版(一)

昨天有幸拜读了洞庭散人的<基于朴素贝叶斯分类器的文本分类算法>,我正在学习这个,我从内心感谢洞庭散人的分享!随即我把它移植到了c#平台上。

该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0.

ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):

Code

 

ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):

Code

 

中文分词器代码:

Code

 

训练管理器代码:

Code

 

先验概率计算代码:

Code

 

条件概率计算代码:

Code

 

用于保存分类结果的类:

Code

 

贝叶斯分类器代码:

Code

 

代码太多,编辑的时候卡的很,于是再整个(二)

posted @ 2009-02-25 09:04  waemz  阅读(5188)  评论(12编辑  收藏  举报