会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
peghoty
新随笔
联系
订阅
管理
2014年3月10日
TF-IDF 简介
摘要: 假设我们手头有大量的文档(或网页), 通常我们会比较关心以下几个问题:1. 每一个文档的关键词(或主题词)包括哪些?2. 给定一个(或一组)关键词,与这个(或组)词最相关的文档是哪一个?3. 给定一个文档,哪个(或哪些)文档与它具有最大的相似度呢? 回答上述三...
阅读全文
posted @ 2014-03-10 22:58 peghoty
阅读(214)
评论(0)
推荐(0)
编辑