2015年12月9日

Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a9转自http://www.linuxidc.com/Linux/2012-02/53113.htm

摘要: 1、概述不管程序性能有多高,机器处理能力有多强,都会有其极限。能够快速方便的横向与纵向扩展是Nut设计最重要的原则,以此原则形成以分布式并行计算为核心的架构设计。以分布式并行计算为核心的架构设计是Nut区别于Solr、Katta的地方。Nut是一个Lucene+Hadoop分布式并行计算搜索框架,能... 阅读全文

posted @ 2015-12-09 22:41 1130136248 阅读(164) 评论(0) 推荐(0) 编辑

Lucene4.X 高级应用

摘要: Lucene 简介以及使用Lucene, 一个基于 Java 的开源的全文搜索工具包,可以方便的嵌入到各种应用系统中,实现针对应用的全文索引以及检索功能。目前是 Apache jakarta 项目组的一个子项目,它的目的是为程序员提供工具包,让程序员利用工具包里的强大接口来完成全文检索。下面我们将以... 阅读全文

posted @ 2015-12-09 22:28 1130136248 阅读(201) 评论(0) 推荐(0) 编辑

lucene中Field.Index,Field.Store的一些设置

摘要: lucene在doc.add(new Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储;通过索引属性你可以控制... 阅读全文

posted @ 2015-12-09 22:22 1130136248 阅读(2745) 评论(0) 推荐(1) 编辑

lucene的两种分页操作

摘要: 基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用... 阅读全文

posted @ 2015-12-09 22:03 1130136248 阅读(580) 评论(0) 推荐(0) 编辑

lucene4.7 分页

摘要: 转载自http://my.oschina.net/MrMichael/blog/220782我 们先来看下下面的问题,现在我们的索引里有2亿多的数据,那么现在的需求是,把索引里的全部数据,读取然后写入txt文本里,对于这么一个量级的数据,显 然是不可能一下子全部读取完的,那得要多大的内存才能够支持下... 阅读全文

posted @ 2015-12-09 19:58 1130136248 阅读(972) 评论(0) 推荐(0) 编辑

lucene4.7学习总结

摘要: 转载自http://blog.csdn.net/mdcmy/article/details/38167955?utm_source=tuicool&utm_medium=referral lucene4.7学习总结 花了一段时间学习lucene今天有时间把所学的写下来,网上有很多文章但大部分都是2... 阅读全文

posted @ 2015-12-09 17:14 1130136248 阅读(234) 评论(0) 推荐(0) 编辑

导航