会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading...
Mr.Yan
首页
新随笔
联系
管理
2019年4月7日
TF-IDF
摘要: 1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如在文本挖掘预处理之向量化与Hash Trick这篇文章中,我们将下面4个短文本做了词频统计: corpus=["I come to China to travel", "This is a c
阅读全文
posted @ 2019-04-07 17:53 严康
阅读(210)
评论(0)
推荐(0)
编辑
公告