会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ZhangHT97
博客园
首页
新随笔
联系
订阅
管理
2020年7月26日
TF-IDF计算相似度为什么要对稀疏向量建立索引?
摘要: ##TF-IDF的向量表示的稀疏问题 之前在看tf-idf代码时候思考了一个问题,不知道对于初学的大部分同学有没有这样一个疑惑,用tf-idf值构成的向量,维度可能跟词表的大小有关,那么对于一句话来说,这样的向量表示是不是太稀疏了? 例如,对于下面的数据(文档),词表大小为32个词,那么我们每一句话
阅读全文
posted @ 2020-07-26 16:15 ZhangHT97
阅读(698)
评论(0)
推荐(0)
编辑
公告