2021年2月4日

jieba自定义idf库

摘要: 先建个list,名字叫:data_content 里面的内容如上图。要把数据处理成上面那样的 先分词、过滤。 最后引入如下代码: import math idf_dic = {} #data_content是分析文本 doc_count = len(data_content) # 总共有多少篇文章 阅读全文

posted @ 2021-02-04 13:04 耀扬 阅读(1072) 评论(0) 推荐(0) 编辑

导航