摘要: 搜索之BM25和BM25F模型 BM25算法浅析 阅读全文
posted @ 2015-06-15 14:35 勿妄 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 目前,真正在搜索引擎等实际应用中广泛使用的是tf-idf模型。tf-idf模型的主要思想是:如果词w在一篇文档d中出现的频率高,并且在其他文档中很少出现,则认为词w具有很好的区分能力,适合用来把文章d和其他文章区分开来。该模型主要包含了两个因素:1) 词w在文档d中的词频tf (Term Frequ... 阅读全文
posted @ 2015-06-15 10:59 勿妄 阅读(303) 评论(0) 推荐(0) 编辑