会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
牛顿
博客园
首页
新随笔
联系
管理
2015年1月30日
文本相似度算法——空间向量模型的余弦算法和TF-IDF
摘要: 1.信息检索中的重要发明TF-IDF TF-IDF是一种统计方法,TF-IDF的主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF词频(Term Frequency)指的是某一个给定的词语在该文件中出现的次...
阅读全文
posted @ 2015-01-30 16:08 Mars、少年
阅读(15783)
评论(0)
推荐(0)
编辑
公告