Fork me on GitHub
摘要: 利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 1、训练词向量 数据预处理参考利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) ,现在我们有了分词后的train_jieba.txt和test_jieba.txt,看一下部分内容: fenci_pa 阅读全文
posted @ 2020-10-18 17:02 西西嘛呦 阅读(2143) 评论(0) 推荐(1) 编辑