07 2017 档案

摘要:中文文本分类不像英文文本分类一样只需要将单词一个个分开就可以了,中文文本分类需要将文字组成的词语分出来构成一个个向量。所以,需要分词。 这里使用网上流行的开源分词工具结巴分词(jieba),它可以有效的将句子里的词语一个个的提取出来,关于结巴分词的原理此处不再赘述,关键是他的使用方法。1、安装 结巴 阅读全文
posted @ 2017-07-10 10:25 乡间小路 阅读(4854) 评论(1) 推荐(3) 编辑
摘要:1、贝叶斯定理 贝叶斯条件概率公式的核心思想是利用容易知道的条件概率来推导出感兴趣的条件概率,公式如下: P(B|A)=P(A|B)P(B)/P(A) 想要知道A发生后发生B的概率,可以用B发生后发生A的概率乘以B发生的概率再除A发生的概率。 2、贝叶斯定理在文本分类中的具体使用原理 我们知道文本都 阅读全文
posted @ 2017-07-03 17:09 乡间小路 阅读(588) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示