摘要: 打上SOLR-236_collapsing.patch补丁,实现 solr 搜索结果折叠、除去重复的搜索结果,可以实现类似google搜索结果的“站内的其它相关信息 ”。solr collapsing patch 是用 hash 某个字段来实现折叠重复结果的。下面我演示下应用这个补丁并搜索试用下。其实 solr 上已经有了这功能的实现:solr 1.3 collapse patch, 请看:https://issues.apache.org/jira/browse/SOLR-236,我这里下载是了新的:https://issues.apache.org/jira/secure/attach.. 阅读全文
posted @ 2011-11-01 17:25 爱开卷360 阅读(3656) 评论(2) 推荐(0) 编辑
摘要: 首先说一下lucene对文档的评分规则:score(q,d) = coord(q,d) ·queryNorm(q) ·∑(tf(t in d) ·idf(t)2·t.getBoost() ·norm(t,d))具体可以查看相关文章:http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html这里先考虑三个因素coord(q,d)与tf(t in d),当查询串中,命中的词越多,coord计算的值则越大,某个词在文档中出现的次数越多则tf的值越大。还有就是norm(t,d),这个主 阅读全文
posted @ 2011-11-01 15:33 爱开卷360 阅读(2684) 评论(0) 推荐(0) 编辑
摘要: lucene对索引的更新比solr麻烦,solr只需要调用一个函数UpdateRequest.setAction(AbstractUpdateRequest.ACTION.COMMIT, false, false)就完成了更新,而lucene需要先删除再更新,否则就变成增量索引了lucene更新索引:http://langhua9527.iteye.com/blog/582347前面已经简单介绍了solr的安装与使用,下面来看看如何用客户端solrj来建立索引及查询view plainimportjava.io.IOException;importjava.util.ArrayList;imp 阅读全文
posted @ 2011-11-01 15:16 爱开卷360 阅读(7775) 评论(3) 推荐(0) 编辑