摘要: 简介:文本挖掘中,情感分析是经常需要使用到,而进行主题模型分析之前,对数据集进行文本分类再进行分析具有必要性,因为分类以后,每一类的主题才会更明显。而snownlp是一个python写的类库,可以方便的处理中文文本内容,主要看上了他的情感分类功能(二分类),分类是基于朴素贝叶斯的文本分类方法,当然也 阅读全文
posted @ 2021-03-10 23:13 forxtz 阅读(2489) 评论(0) 推荐(0) 编辑
摘要: 简介:前文python jieba+wordcloud使用笔记+词云分析应用讲到可以自定义Idf文档,所以来处理处理。算法已经有现成,本文讲解基本原理及其使用。 参考链接: sklearn-TfidfVectorizer 计算过程详解 百度百科-tf-idf CountVectorize和TfidV 阅读全文
posted @ 2021-03-10 00:15 forxtz 阅读(958) 评论(1) 推荐(0) 编辑