摘要: 介绍katta 是一个运行在许多商品硬件服务器上的分布式应用,它非常类似于Hadoop MapReduce, Hadoop DFS, HBase, Bigtable 和 Hypertable.概述主节点服务器管理从节点服务器和index shards任务。从节点服务器服务index shards。客户端允许从所有连接的节点上查找数据,并把所有的结果合并成一个结果返回给客户端。数据结构katta的索引是个文件夹,它里面包含一套所谓的index shards(文件形式)。这些子文件包含了Lucene索引。index shards能够很简单的用Lucene的index writer创建。创建一个ka 阅读全文
posted @ 2011-11-29 15:21 爱开卷360 阅读(4087) 评论(4) 推荐(0) 编辑
摘要: 一、总体架构Zoie是一个实时的搜索引擎系统,其需要逻辑上独立的索引和搜索子系统相对紧密的结合在一起,从而使得一篇文档一经索引,就能够立刻被搜索的到。ZoieSystem是Zoie的重要组成部分,其一方面通过实现DataConsumer接口而完成了索引功能,一方面通过实现IndexReaderFactory<ZoieIndexReader<R extends IndexReader>>而完成了搜索功能,并将二者紧密的结合在一起。下面就是ZoieSystem的总体架构图:对于索引系统来讲,ZoieSystem是一个DataConsumer,也即是一个消费者,其有函数con 阅读全文
posted @ 2011-11-29 14:37 爱开卷360 阅读(2342) 评论(1) 推荐(0) 编辑
摘要: Solr的配置网上讲的很多,但是实施总是遇到困难,现总结如下:1.从官网下载solr core的源码包,将solrwar包放到tomcat的webapps文件夹下,其它web容器亦然. 运行tomcat ,解压出来solr的文件夹.2.Single core配置:以solr自带例子做讲解 2.1.新建solrhome目录:d:/test/solrcore/singlecore ,从solr源码的example包下复制solr包 2.2.在tomcat 下的 webappss的solr包 WEB-INF目录下修改web.xml的<env-entry-name>solr/home< 阅读全文
posted @ 2011-11-29 12:36 爱开卷360 阅读(3487) 评论(1) 推荐(0) 编辑
摘要: Apache Solr项目,是一款基于Apache Lucene的开源企业搜索服务器,最近发布了1.3版。InfoQ采访了Solr的创建者Yonik Seeley,了解了新版本的更多信息和Solr提供给最终用户的功能。Seeley首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr的关键特性包括:基于标准的开放接口——Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。易管理——Solr可以通过HTML页面管理,服务器统计数据以JMX输出,Solr配置通过XML完成。分面浏览——搜索结果自动分类。突出显示命中词——匹配的字符自动在搜索结果中高亮显示 阅读全文
posted @ 2011-11-29 11:33 爱开卷360 阅读(1100) 评论(0) 推荐(0) 编辑