摘要: 向@yangliuy大牛学习NLP,这篇博客是数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(上)的Python实现。入门为主,没有太多自己的东西。1. 数据集Newsgroup新闻文档集,含有20000篇左右的Usenet文档,平均分配在20个新闻组,即... 阅读全文