2020 年 10月 18 日随笔档案 - 西西嘛呦

2020年10月18日

摘要：利用TfidfVectorizer进行中文文本分类（数据集是复旦中文语料） 1、训练词向量数据预处理参考利用TfidfVectorizer进行中文文本分类（数据集是复旦中文语料），现在我们有了分词后的train_jieba.txt和test_jieba.txt，看一下部分内容： fenci_pa 阅读全文

posted @ 2020-10-18 17:02 西西嘛呦阅读(2143) 评论(0) 推荐(1) 编辑

西西嘛呦

从自己能做到的开始，一件件来，缓慢而坚定地前进，尽力而为

公告