会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
花生 瓜子 矿泉水
博客园
首页
新随笔
联系
订阅
管理
2024年8月9日
1.14 - 信息检索:TF-IDF/BM25,原理+代码
摘要: 1. TF-IDF 1.1 原理 1.1.1 名词解释 TF:词频,某token在文档中出现的次数越多,则这个token的特征越能代表这篇文档自身的独特特征。 计算:token出现次数 / 文档总token数 IDF:逆文档频率,如果某个token在所有文档中都出现,那么这个token对于区分这些文
阅读全文
posted @ 2024-08-09 14:56 橘子葡萄火龙果
阅读(83)
评论(0)
推荐(0)
编辑
公告