会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
祁俊辉
博客园
首页
新随笔
联系
订阅
管理
2018年10月28日
关于TF-IDF的一些见解
摘要: 1 算法介绍 该算法是一种用于资讯检索和资讯探勘的常用加权技术。 该算法是一种统计方法,用以评估一字词对于一个文本集(语料库)中的其中一份文本的重要程度。 注意:字词的重要性随着它在文本中出现的次数成比增加,但同时会随着它在语料库中出现的频率成反比下降。 2 原理 2.1 词频(term frequ
阅读全文
posted @ 2018-10-28 15:47 祁俊辉
阅读(1113)
评论(0)
推荐(0)
编辑
公告