基于朴素贝叶斯分类器的文本分类算法C#版

该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0.

ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Standard;

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// ICTCLAS分词组件for Lucene.net接口

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ICTCLASAnalyzer : Analyzer

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //定义要过滤的词

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static readonly System.String[] CHINESE_ENGLISH_STOP_WORDS = new string[428];

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string NoisePath = Environment.CurrentDirectory + "\\data\\stopwords.txt";

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ICTCLASAnalyzer()

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            StreamReader reader = new StreamReader(NoisePath, System.Text.Encoding.Default);

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string noise = reader.ReadLine();

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int i = 0;

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while (!string.IsNullOrEmpty(noise))

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                CHINESE_ENGLISH_STOP_WORDS[i] = noise;

30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                noise = reader.ReadLine();

31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                i++;

32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            

34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                /**//**//**//// Constructs a {@link StandardTokenizer} filtered by a {@link

37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生       /// StandardFilter}, a {@link LowerCaseFilter} and a {@link StopFilter}. 

38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public override TokenStream TokenStream(System.String fieldName, System.IO.TextReader reader)

40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            TokenStream result = new ICTCLASTokenizer(reader);

42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new StandardFilter(result);

43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new LowerCaseFilter(result);

44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = new StopFilter(result, CHINESE_ENGLISH_STOP_WORDS);

45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return result;

46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using SharpICTCLAS;

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ICTCLASTokenizer : Tokenizer

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int nKind = 1;

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        List<WordResult[]> result;

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int startIndex = 0;

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int endIndex = 0;

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        int i = 1;

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// 

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 待分词的句子

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string sentence;

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// Constructs a tokenizer for this Reader. 

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ICTCLASTokenizer(System.IO.TextReader reader)

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            this.input = reader;

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            sentence = input.ReadToEnd();

29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            sentence = sentence.Replace("\r\n", "");

30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string DictPath = Path.Combine(Environment.CurrentDirectory, "Data") + Path.DirectorySeparatorChar;

31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            //Console.WriteLine("正在初始化字典库,请稍候");

32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            WordSegment wordSegment = new WordSegment();

33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            wordSegment.InitWordSegment(DictPath);

34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            result = wordSegment.Segment(sentence, nKind);

35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//**/

38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// 进行切词,返回数据流中下一个token或者数据流为空时返回null

39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 

40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public override Token Next()

41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Token token = null;

43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while (i < result[0].Length - 1)

44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string word = result[0][i].sWord;

46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                endIndex = startIndex + word.Length - 1;

47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                token = new Token(word, startIndex, endIndex);

48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                startIndex = endIndex + 1;

49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                i++;

51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                return token;

52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return null;

55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

中文分词器代码:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis;

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Standard;

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Documents;

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.Cn;

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using Lucene.Net.Analysis.KTDictSeg;

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 中文分词器

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ChineseSpliter

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static string Split(string text, string splitToken)

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            StringBuilder sb = new StringBuilder();

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Analyzer an = new ICTCLASAnalyzer();

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            //TokenStream ts = an.ReusableTokenStream("", new StringReader(text));

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            TokenStream ts = an.TokenStream("", new StringReader(text));

29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            Lucene.Net.Analysis.Token token;

31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            while ((token = ts.Next()) != null)

32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                sb.Append(splitToken + token.TermText());

34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return sb.ToString().Substring(1);

37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

训练管理器代码:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

  1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

  2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

  3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

  4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.IO;

  5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

  6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text.RegularExpressions;

  7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

  8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

  9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

 12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 训练管理器

 13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

 14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class TrainingDataManager

 15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string[] trainingFileClassicfications; //训练预料分类数组

 17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private DirectoryInfo trainingTextDir; //训练预料存放目录

 18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private string defaultDir = "D:\\SogouC.mini.20061127\\SogouC.mini\\Sample";

 19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //private string defaultDir = @"J:\SogouC.reduced.20061127\SogouC.reduced\Reduced";

 20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public TrainingDataManager()

 22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            if (!Directory.Exists(defaultDir))

 24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                throw new Exception("当前语料目录不存在!");

 26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

 27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            trainingTextDir = new DirectoryInfo(defaultDir);

 28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            trainingFileClassicfications = Directory.GetDirectories(defaultDir,"*",SearchOption.TopDirectoryOnly);

 30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < trainingFileClassicfications.Length; i++)

 32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                trainingFileClassicfications[i] = (Regex.Split(trainingFileClassicfications[i], "\\\\"))[(Regex.Split(trainingFileClassicfications[i], "\\\\")).Length - 1];

 34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                //Console.WriteLine(trainingFileClassicfications[i]);

 35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

 36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

 37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

 39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取分类列表

 40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

 41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

 42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string[] GetTrainingClassifications()

 43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return trainingFileClassicfications;

 45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

 46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

 48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类下的文件路径

 49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

 50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification"></param>

 51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

 52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string[] GetFilesPath(string classification)

 53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] ret = Directory.GetFiles(defaultDir+"\\"+classification);

 55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生           

 56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

 57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

 58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 59基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

 60基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定位置的文件内容

 61基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

 62基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="filepath"></param>

 63基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

 64基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string GetFileText(string filepath)

 65基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 66基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            FileStream fs = new FileStream(filepath, FileMode.Open, FileAccess.Read, FileShare.Read);

 67基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            byte[] bt = new byte[fs.Length];

 68基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            fs.Read(bt, 0, bt.Length);

 69基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            fs.Close();

 70基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string s = Encoding.Default.GetString(bt);

 71基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return s;

 72基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

 73基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 74基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

 75基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取训练文本集中的文本数目

 76基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

 77基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

 78基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetTrainFileCount()

 79基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 80基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

 81基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < trainingFileClassicfications.Length; i++)

 82基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 83基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ret += GetTrainFileCountOfCertainClassification(trainingFileClassicfications[i]);

 84基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

 85基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

 86基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

 87基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 88基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

 89基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类下的文本数目

 90基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

 91基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification"></param>

 92基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

 93基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetTrainFileCountOfCertainClassification(string classification)

 94基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 95基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

 96基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 97基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = Directory.GetFiles(defaultDir + "\\" + classification).Length;

 98基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 99基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

100基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

101基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

102基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

103基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 获取指定分类包含关键字或关键词的样本数目

104基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

105基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="classification">指定分类</param>

106基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="key">关键词或关键字</param>

107基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>样本数目</returns>

108基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public int GetCountContainKeyOfClassification(string classification, string key)

109基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

110基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            int ret = 0;

111基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] filepaths = GetFilesPath(classification);

112基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            try

113基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

114基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                

115基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                for (int i = 0; i < filepaths.Length; i++)

116基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

117基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    string text = GetFileText(filepaths[i]);

118基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    if (text.Contains(key))

119基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

120基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                        ret++;

121基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    }

122基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                }

123基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

124基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            catch

125基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

126基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                throw new Exception("error!");

127基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

128基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

129基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

130基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

131基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

132基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 

先验概率计算代码:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 先验概率(事先概率)计算

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class PriorProbability

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static TrainingDataManager tdm = new TrainingDataManager();

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 计算先验概率

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="c">给定的分类</param>

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>给定条件下的先验概率</returns>

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static float CaculatePc(string c)

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 0F;

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nc = tdm.GetTrainFileCountOfCertainClassification(c);

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float N = tdm.GetTrainFileCount();

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = Nc / N;

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

条件概率计算代码:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 条件概率计算

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ClassConditionalProbability

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static TrainingDataManager tdm = new TrainingDataManager();

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static float M = 0F;

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 类条件概率

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="x">给定关键字</param>

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="c">给定分类</param>

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns></returns>

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public static float CaculatePxc(string x, string c)

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 0F;

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nxc = tdm.GetCountContainKeyOfClassification(c, x);

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float Nc = tdm.GetTrainFileCountOfCertainClassification(c);

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float V = tdm.GetTrainingClassifications().Length;

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = (Nxc + 1) / (Nc + V + M);//为避免出现0这样的极端情况,进行加权处理

30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

用于保存分类结果的类:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 保存分类结果

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class ClassifyResult

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public double probability; //分类概率

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string classification;  //分类

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public ClassifyResult()

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            probability = 0;

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            classification = string.Empty;

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

 

贝叶斯分类器代码:

基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生Code

 1基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System;

 2基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Collections.Generic;

 3基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生using System.Text;

 4基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

 5基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生namespace AspxOn.Search.FenLei

 6基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

 7基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /**//// <summary>

 8基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// 朴素贝叶斯分类器

 9基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    /// </summary>

10基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    public class BayesClassifier

11基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

12基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

13基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private TrainingDataManager tdm; //训练集合管理器

14基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        //private string trainingDataPath; //训练集合路径

15基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        private static float zoomFactor = 10.0F;

16基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

17基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

18基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 默认构造器,初始化训练集合

19基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

20基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public BayesClassifier()

21基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

22基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            tdm = new TrainingDataManager();

23基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

24基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

25基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

26基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 计算给定的文本属性向量X在给定的分类Cj中的类条件概率

27基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

28基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="X">文本属性向量X</param>

29基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="Cj">给定的分类</param>

30基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>分类条件概率连乘值</returns>

31基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        protected float CaluProd(string[] X, string Cj)

32基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

33基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float ret = 1.0F;

34基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < X.Length; i++)

35基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

36基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string Xi = X[i];

37基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ret *= ClassConditionalProbability.CaculatePxc(Xi, Cj) * zoomFactor;//因为数值过小,因此将连乘值放大10倍(通过乘以zoomFactor)

38基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

39基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret *= PriorProbability.CaculatePc(Cj); //再乘以先验概率

40基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return ret;

41基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

42基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

43基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /**//// <summary>

44基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// 对指定文本进行分类

45基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// </summary>

46基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <param name="text">指定文本</param>

47基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        /// <returns>分类结果</returns>

48基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public List<ClassifyResult> Classify(string text)

49基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

50基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] terms = ChineseSpliter.Split(text, "|").Split('|'); //中文分词处理(分词结果可能包含停用词)

51基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string[] classes = tdm.GetTrainingClassifications();  //分类列表数组

52基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            float probility = 0.0F;

53基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            List<ClassifyResult> crs = new List<ClassifyResult>(); //分类结果

54基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < classes.Length; i++)

55基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

56基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                string Ci = classes[i];

57基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                probility = CaluProd(terms, Ci); //计算给定的文本属性向量terms在给定的分类Ci中的分类条件概率

58基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                ClassifyResult cr = new ClassifyResult();

59基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                cr.classification = Ci;

60基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                cr.probability = probility;

61基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                crs.Add(cr);

62基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

63基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return crs;

64基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

65基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生

66基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        public string GetMaxNum(List<ClassifyResult> crs)

67基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

68基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            double ret = 0;

69基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            string classification = string.Empty;

70基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            ret = crs[0].probability;

71基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            for (int i = 0; i < crs.Count; i++)

72基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

73基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                if (crs[i].probability > ret)

74基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生{

75基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    ret = crs[i].probability;

76基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                    classification = crs[i].classification;

77基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生                }

78基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            }

79基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生            return classification;

80基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生        }

81基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生    }

82基于朴素贝叶斯分类器的文本分类算法C版( - piao8163 - 快乐人生}

posted @ 2010-04-27 21:45  searchDM  阅读(547)  评论(0编辑  收藏  举报