摘要: 网上很多人把什么文本分类说的神乎其技,搞的我非常火大花了一个通宵阅读了N个文本分类的开源代码,总结了一下其实简单的难以置信:先验概率计算=某分类文档总数/所有分类文档总数分类条件概率计算=某分类包含关键词的训练文档总数+1/(某分类的训练文档总数+分类总数)文本某分类条件概率=所有词汇的分类条件概率的乘积*先验概率最终分类就是根据上面的结果排序概率最大的就表示属于某分类的可能性越大明明三句话就能说清楚的事,专家们长篇大论,为何?交流QQ群:204725117 阅读全文
posted @ 2013-04-28 10:15 chinacloudy 阅读(349) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示