随笔分类 -  Lucene

摘要:转自: http://www.oschina.net/question/5189_7707 Lucene 评分体系/机制(lucene scoring)是 Lucene 出名的一核心部分。它对用户来说隐藏了很多复杂的细节,致使用户可以简单地使用 lucene。但个人觉得:如果要根据自己的应用调节评分(或结构排序),十分有必须深入了解 lucene 的评分机制。 Lucene scoring ... 阅读全文
posted @ 2015-08-30 17:32 Vincent.Cai2010 阅读(498) 评论(0) 推荐(0) 编辑
摘要:转自: http://lutaf.com/210.htm Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序 TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则 某个词或短语在一篇文章中出现的次数越多,越相关 整个文档集合中包含某个词的文档数量越... 阅读全文
posted @ 2015-08-30 17:18 Vincent.Cai2010 阅读(420) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示