会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Hongyu
数据分析;风控反欺诈;读书随笔
博客园
首页
新随笔
联系
订阅
管理
2018年4月28日
使用sklearn进行中文文本的tf idf计算
摘要: Created by yinhongyu at 2018 4 28 email: hyhyin@163.com 使用jieba和sklearn实现了tf idf的计算 1 读取数据文件 数据爬取自新浪新闻,以"中美贸易战"为关键词,按照相关度搜索,爬取了搜索结果的前100页新闻的正文; 标题 来源
阅读全文
posted @ 2018-04-28 12:12 Yinhongyu
阅读(1484)
评论(0)
推荐(0)
编辑