随笔 - 656  文章 - 1  评论 - 265  阅读 - 321万

随笔分类 -  Lucene

分布式搜索方案选型
摘要:分布式搜索方案选型之一:Solr我第一个了解到的分布式搜索框架是solr,它是由java开发的,基于lucene的分布式搜索引擎,提供了类似于webserver的编程接口,是一个比较成熟的搜索引擎,目前很多公司都在使用。很快我就部署了一个由4台机器组成的solr集群,开始导公司的数据进去测试,导的数据为200万。导入速度非常快。接下来就开始测试查询效率,发现它是有缓存的,第一次查询的时间基本上在80~150毫秒之间,第二次查由于有缓存,查询时间基本上只需要18~35毫秒,可以说非常之快。它如何做到分布式?因为现在做的是集群,每台机器存储的信息是一样的,怎样做到把索引信息进行拆分?于是就到sol 阅读全文
posted @ 2012-08-29 22:00 草原和大树 阅读(5815) 评论(1) 推荐(2) 编辑
初识Lucene【转】
摘要:1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,... 阅读全文
posted @ 2008-08-12 09:24 草原和大树 阅读(388) 评论(0) 推荐(0) 编辑
lucene学习笔记 (转载:http://www.cnblogs.com/bysshijiajia/articles/1237466.html)
摘要:1. 有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆分成多个包含部分Fiel... 阅读全文
posted @ 2008-08-12 09:22 草原和大树 阅读(821) 评论(0) 推荐(0) 编辑
Lucene.Net 系列(摘自:http://www.lucene.com.cn/net.htm)
摘要:Lucene.Net 系列一本文介绍了什么是Lucene,Lucene能做什么. 如何从一个文件夹下的所有txt文件中查找特定的词? 本文将围绕该个实例介绍了lucene.net的索引的建立以及如何针对索引进行搜索.最后还将给出源代码供大家学习. 源代码下载 What’s Lucene Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能. Lucene... 阅读全文
posted @ 2008-08-12 09:14 草原和大树 阅读(904) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示