君子博学而日参省乎己 则知明而行无过矣

博客园 首页 新随笔 联系 订阅 管理

随笔分类 -  lucene.net&solr

1 2 3 4 5 ··· 7 下一页

该文被密码保护。
posted @ 2014-12-05 11:36 刺猬的温驯 阅读(0) 评论(0) 推荐(0) 编辑

该文被密码保护。
posted @ 2014-12-05 11:35 刺猬的温驯 阅读(0) 评论(0) 推荐(0) 编辑

该文被密码保护。
posted @ 2014-12-05 11:31 刺猬的温驯 阅读(2) 评论(0) 推荐(0) 编辑

该文被密码保护。
posted @ 2014-12-05 11:29 刺猬的温驯 阅读(1) 评论(0) 推荐(0) 编辑

该文被密码保护。
posted @ 2014-11-20 01:08 刺猬的温驯 阅读(5) 评论(0) 推荐(0) 编辑

摘要:互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库。在这样严峻的条件下,一批又一批的创业者从创业中获得成功,这个和当前的开源技术、海量数据架构有着必不可分的关系。比如我们使用mysql、nginx等开源软件,通过架构和低成本服务器也可以搭建千万级用户访问量的系... 阅读全文
posted @ 2014-10-17 17:14 刺猬的温驯 阅读(387) 评论(0) 推荐(0) 编辑

摘要:假如你像用lucene来作分组,比如按类别分组,这种功能,好了你压力大了,lucene本身是不支持分组的。当你想要这个功能的时候,就可能会用到基于lucene的搜索引擎solr。不过也可以通过编码通过FieldCache和单字段,对索引进行分组,比如:想构造类别树。大类里面还有小类那种。这个功能实现... 阅读全文
posted @ 2014-07-07 22:00 刺猬的温驯 阅读(2153) 评论(0) 推荐(0) 编辑

摘要:使用Lucene来搜索内容,搜索结果的显示顺序当然是比较重要的.Lucene中Build-in的几个排序定义在大多数情况下是不适合我们使用的.要适合自己的应用程序的场景,就只能自定义排序功能,本节我们就来看看在Lucene中如何实现自定义排序功能. Lucene中的自定义排序功能和Java集合中的... 阅读全文
posted @ 2014-06-29 02:34 刺猬的温驯 阅读(1606) 评论(0) 推荐(0) 编辑

摘要:连接器里面采用的什么样的数据结构,我们先从Document迭代器开始入手,具体的Document迭代器类都实现了DocumentList接口,该接口定义了两个方法public interface DocumentList { public Document nextDocument() throw... 阅读全文
posted @ 2014-06-15 18:36 刺猬的温驯 阅读(520) 评论(0) 推荐(0) 编辑

摘要:在哪里调用监控器管理对象snapshotRepositoryMonitorManager的start方法及stop方法,然后又在哪里调用CheckpointAndChangeQueue对象的resume方法获取List guaranteedChanges集合下面跟踪到DiffingConnector... 阅读全文
posted @ 2014-06-15 18:02 刺猬的温驯 阅读(811) 评论(0) 推荐(0) 编辑

摘要:通常一个SnapshotRepository仓库对象对应一个DocumentSnapshotRepositoryMonitor监视器对象,同时也对应一个快照存储器对象,它们的关联是通过监视器管理对象DocumentSnapshotRepositoryMonitorManagerImpl实现的Docu... 阅读全文
posted @ 2014-06-15 17:26 刺猬的温驯 阅读(1029) 评论(0) 推荐(0) 编辑

摘要:ChangeQueue类实现ChangeSource接口,声明了拉取下一条Change对象的方法 * A source of {@link Change} objects. * * @since 2.8 */public interface ChangeSource { /** * @retu... 阅读全文
posted @ 2014-06-15 16:44 刺猬的温驯 阅读(594) 评论(0) 推荐(0) 编辑

摘要:连接器通过监视器对象DocumentSnapshotRepositoryMonitor从上文提到的仓库对象SnapshotRepository(数据库仓库为DBSnapshotRepository)中迭代获取数据监视器类DocumentSnapshotRepositoryMonitor在其构造方法初... 阅读全文
posted @ 2014-06-15 15:39 刺猬的温驯 阅读(325) 评论(0) 推荐(0) 编辑

摘要:下面开始具体分析连接器是怎么与连接器实例交互的,这里主要是分析连接器怎么从连接器实例获取数据的(前面文章有涉及基于http协议与连接器的xml格式的交互,连接器对连接器实例的设置都是通过配置文件操作的,具体文件操作尚未详细分析(com.google.enterprise.connector.pers... 阅读全文
posted @ 2014-06-15 11:15 刺猬的温驯 阅读(446) 评论(0) 推荐(0) 编辑

摘要:本人在上文中提到,连接器实现了两种事件依赖的机制 ,其一是我们手动操作连接器实例时;其二是由连接器的自动更新机制上文中分析了连接器的自动更新机制,即定时器执行定时任务那么,如果我们手动操作连接器实例时,是怎么发出事件更新连接器实例的呢通过eclipse开发工具,追踪调用ChangeDetector接... 阅读全文
posted @ 2014-06-08 18:04 刺猬的温驯 阅读(281) 评论(0) 推荐(0) 编辑

摘要:我们在前面的文章已经看到,ConnectorCoordinatorImpl类也实现了ChangeHandler接口,本文接下来分析实现该接口的作用class ConnectorCoordinatorImpl implements ConnectorCoordinator, ChangeHan... 阅读全文
posted @ 2014-06-08 16:59 刺猬的温驯 阅读(470) 评论(0) 推荐(0) 编辑

摘要:下面来分析线程执行类,线程池ThreadPool类对该类的理解需要对java的线程池比较熟悉该类引用了一个内部类/** * The lazily constructed LazyThreadPool instance. */ private LazyThreadPool lazyThrea... 阅读全文
posted @ 2014-06-08 13:09 刺猬的温驯 阅读(396) 评论(0) 推荐(0) 编辑

摘要:从上文中的QueryTraverser对象的BatchResult runBatch(BatchSize batchSize)方法上溯到CancelableBatch类,该类实现了TimedCancelable接口,后者又extends了TimedCancelable接口,后者又extends了Ca... 阅读全文
posted @ 2014-06-08 01:33 刺猬的温驯 阅读(437) 评论(0) 推荐(0) 编辑

摘要:连接器里面衔接数据源与数据推送对象的是QueryTraverser类对象,该类实现了Traverser接口/** * Interface presented by a Traverser. Used by the Scheduler. */public interface Traverser { ... 阅读全文
posted @ 2014-06-07 23:24 刺猬的温驯 阅读(357) 评论(0) 推荐(0) 编辑

摘要:连接器是基于http协议通过推模式(push)向数据接收服务端推送数据,即xmlfeed格式数据(xml格式),其发送数据接口命名为PusherPusher接口定义了与发送数据相关的方法public interface Pusher { /** * Status indicating the ... 阅读全文
posted @ 2014-06-07 22:59 刺猬的温驯 阅读(644) 评论(0) 推荐(0) 编辑

1 2 3 4 5 ··· 7 下一页