摘要: Created by yinhongyu at 2018 4 28 email: hyhyin@163.com 使用jieba和sklearn实现了tf idf的计算 1 读取数据文件 数据爬取自新浪新闻,以"中美贸易战"为关键词,按照相关度搜索,爬取了搜索结果的前100页新闻的正文; 标题 来源 阅读全文
posted @ 2018-04-28 12:12 Yinhongyu 阅读(1476) 评论(0) 推荐(0) 编辑