Lucene.net常见功能实现知识汇总

在开发站内搜索引擎的时候，经常会遇到一些搜索引擎的常见功能如何实现的问题，比如实现相关度百分比显示？如何实现在结果中搜索等等诸如此类常见的问题，本文总结我在开发站内搜索引擎过程中遇到的问题，整理分享给需要的园友们：

问：Lucene.net的搜索结果的百分比相关度值是如何实现的？
答：
Hits result = searcher.Search(q);
float score = result.Score(n) ;//n为查询结果文挡序号，返回的是一个<=1f的float的值，表示为百分比字符串：score.ToString("0%") ;

问：如何通过编程的方式改变Lucene.net的锁文件存放的位置？
答：
    Lucene.net的锁文件默认是存放系统临时文件夹,可以通过下面的语句来修改
    System.Configuration.ConfigurationSettings.AppSettings.Add("Lucene.Net.lockDir", "your new lockDir") ;
    通过FSDirectory.LOCK_DIR可以获得锁文件存放的位置(文件夹)

问：如何判断某个索引库被锁定,如何强制解除锁定？
答：
   具体实现，可以参看Lucene.Net.Store.FSDirectory的Obtain()(判断是否锁定)方法和Release()方法(解除锁定)
   备注：还有一个IsLocked方法也可以参考下。

问：如何实现多个索引的联合搜索？
答：
   IndexSearcher[] searchers = new IndexSearcher[2];
   searchers[0] = new IndexSearcher(dir1) ;
   searchers[1] = new IndexSearcher(dir2) ;

   MultiSearcher searcher = new MultiSearcher(searchers) ;//或ParallelMultiSearcher searcher = new ParallelMultiSearcher(searchers) ;
   searcher.Search(query) ;

   ParallelMultiSearcher与MultiSearcher的区别，前者为每一个索引单独开一个线程,以多线程的方式同步搜索；后者是逐个依次搜索，然后合并；
   所以ParallelMultiSearcher的搜索总用时是最慢的哪个索引的搜索用时，MultiSearcher则是搜索总用时等于所有索引搜索用时之和；

问：如何实现在结果中搜索？
答：
    *方法一，使用CachingWrapperFilter。不能实现无限级的“在结果中搜索”:
    QueryParser parser = new QueryParser("content", analyzer);

    Query currentQuery = parser.Parse(currentKeyword) ;
Query oldQuery = parser.Parse(oldKeyword) ;

QueryFilter oldFilter = new QueryFilter(oldQuery) ;
CachingWrapperFilter filter = new CachingWrapperFilter(oldFilter) ;

IndexSearcher searcher = new IndexSearcher(indexDir);

Hits result = searcher.Search(currentQuery, filter) ;

*方法二，将多个查询关键词做AND的BooleanQuery或者直接构造查询Sytax传给QueryParser，都可以实现无限级的“在结果中搜索“。

问：BooleanQuery.maxClauseCount的含义？
答：
添加到BooleanQuery的最多的Query数，默认是1024。超过该值会抛出TooManyClauses异常，可以通过BooleanQuery.SetMaxClauseCount(int)设置新的值。

备注：含义解释未明确。

问：如何判断一个索引库是否存在？
答：
   string indexPath = "your indexPath" ; //索引所在目录
   if (System.IO.Directory.Exists(indexPath) && System.IO.File.Exists(Path.Combine(indexPath,"segments")
      //存在
   else
      //不存在

   当然有更直接的方法
   if (Lucene.Net.Index.IndexReader.IndexExists(indexPath))
     //存在
   else
     //不存在

   Lucene.Net.Index.IndexReader.IndexExists方法内部的实现方式和上面的类似，当然直接用Lucene.Net.Index.IndexReader.IndexExists更可靠些。

posted @ 2012-11-10 17:22 kwklover 阅读(2408) 评论(3) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· 展开说说关于C#中ORM框架的用法！
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？

历史上的今天：
2006-11-10 SQL SERVER2005 Client Download info
2006-11-10 CommunityServer2.0改造的一些心得[粗糙版]

Lucene.net常见功能实现知识汇总

公告

搜索

随笔分类 (23)

文章分类 (89)

友情Links

阅读排行榜

推荐排行榜

最新评论