2013 年 12月 21 日随笔档案 - 郑文亮

2013年12月21日

摘要：如何提高Lucene构建索引的速度 hans(汉斯) 2013-01-27 10:12对于Lucene>=2.3：IndexWriter可以自行根据内存使用来释放缓存。调用writer.setRAMBufferSizeMB()方法设置缓存尺寸。确保你没有任何的遗留代码调用setMaxBufferedDocs方法，因为写入器可以根据两种情况一起释放缓存（哪个更早发生）。使用你可以提供的全部内存。在释放缓存之前使用更多的内存，意味着Lucene写入更大的段，意味着延迟合并的发生。LUCENE-843中的测试发现，针对所测内容集合48MB内存是最优值，但是，你的应用可能有不同的最优值。关闭复合阅读全文

posted @ 2013-12-21 16:03 郑文亮阅读(685) 评论(0) 推荐(0) 编辑

完整的站内搜索Demo(Lucene.Net+盘古分词)

摘要：前言首先自问自答几个问题,以让各位看官了解写此文的目的什么是站内搜索？与一般搜索的区别？很多网站都有搜索功能,很多都是用SQL语句的Like实现的,但是Like无法做到模糊匹配（例如我搜索“.net学习”,如果有“.net的学习”,Like就无法搜索到，这明显不符合需求,但是站内搜索就能做到）,另外Like会造成全盘扫描,会对数据库造成很大压力，为什么不用数据库全文检索，跟普通SQL一样,很傻瓜,灵活性不行为什么不用百度、google的站内搜索？毕竟是别人的东西,用起来肯定会受制于人（哪天你的网站火了,它看你不爽了,就可能被K）,主要还是索引的不够及时,网站新的内容,需要一定时间才能.. 阅读全文

posted @ 2013-12-21 15:16 郑文亮阅读(530) 评论(1) 推荐(0) 编辑

Lucene多字段搜索

摘要：最近在学习Lucene的过程中遇到了需要多域搜索并排序的问题，在网上找了找，资料不是很多，现在都列出来，又需要的可以自己认真看看，都是从其他网站粘贴过来的，所以比较乱，感谢原创的作者们！使用MultiFieldQueryParser类即可。示例代码：Java代码packagecom.lucene.search;importjava.io.File;importjava.io.IOException;54com.cnimportorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.queryPa 阅读全文

posted @ 2013-12-21 09:26 郑文亮阅读(8080) 评论(1) 推荐(0) 编辑

Lucene的多域查询、结果中查询、查询结果分页、高亮查询结果和结果评分

摘要： 1.针对多个域的一次性查询1.1.三种方案使用lucene构造搜索引擎的时候，如果要针对多个域进行一次性查询，一般来说有三种方法：第一种实现方法是创建多值的全包含域的文本进行索引，这个方案最简单。但是这个防范有个缺点：你不能直接对每个域的加权进行控制。第二种方法是使用MultiFieldQueryParser，它是QueryParser的子类，它会在后台程序中实例化一个QueryParser对象，用来针对每个域进行查询表达式的解析，然后使用BooleanQuery将查询结果合并起来。当程序向BooleanQuery添加查询子句时，默认操作符OR被用于最简单的解析方法中。为了实现... 阅读全文

posted @ 2013-12-21 09:23 郑文亮阅读(9791) 评论(2) 推荐(3) 编辑

公告