摘要: 使用pyhanlp创建词云去年我曾经写过一篇文章Python + wordcloud + jieba 十分钟学会用任意中文文本生成词云(你可能觉得这和wordcloud中官方文档中的中文词云的例子代码很像,不要误会,那个也是我写的)现在我们可以仿照之前的格式... 阅读全文
posted @ 2018-09-25 22:19 FontTian 阅读(1330) 评论(0) 推荐(0) 编辑
摘要: 文本聚类文本聚类简单点的来说就是将文本视作一个样本,在其上面进行聚类操作。但是与我们机器学习中常用的聚类操作不同之处在于。我们的聚类对象不是直接的文本本身,而是文本提取出来的特征。因此如何提取特征因而是非常重要的一步。在HanLP中一共有三个文本聚类方法。前... 阅读全文
posted @ 2018-09-25 21:27 FontTian 阅读(1211) 评论(0) 推荐(0) 编辑