随笔分类 -  Lucene.Net 2.3.1

摘要:本文简单介绍Lucene.Net实现GroupBy效果的方法 阅读全文
posted @ 2009-07-28 21:56 Birdshover 阅读(7254) 评论(13) 推荐(9) 编辑
摘要:Lucene的文件系统分为内存和硬盘两个部分,文件逻辑组织方式暂且不提,本文将关注其物理结构,包括它在内存中如何存放,以及如何写入硬盘。 阅读全文
posted @ 2009-02-18 14:55 Birdshover 阅读(5194) 评论(7) 推荐(0) 编辑
摘要:索引时会抛出“System.IndexOutOfRangeException,索引超出了数组界限。”异常。 阅读全文
posted @ 2009-02-16 13:39 Birdshover 阅读(5083) 评论(6) 推荐(0) 编辑
摘要:特殊符号的问题,还是跟分词器息息相关的。在使用多条件或者构造搜索表单式的时候尽量使用内置类,而尽量不要手动构造查询字符串。 阅读全文
posted @ 2008-12-01 16:04 Birdshover 阅读(8312) 评论(13) 推荐(1) 编辑
摘要:本节终于开始介绍用Lucene.Net做搜索引擎中很重要的一个概念——表达式。介绍了表达式的与或非运算,以及如何用Query构造与或非关系。 阅读全文
posted @ 2008-09-26 20:56 Birdshover 阅读(8708) 评论(21) 推荐(0) 编辑
摘要:本文简单阐述了搜索是一个什么样的体系,在进入后面丰富多彩的体验之前,这篇显得很单调,呵呵。 阅读全文
posted @ 2008-09-23 21:00 Birdshover 阅读(9201) 评论(19) 推荐(2) 编辑
摘要:本篇作为索引部分的完结篇,简单介绍了IndexWriter的常用方法,以及索引部署上的一些思考。IndexWriter像是CPU的指令集,更多的业务逻辑还需要自己思考。 阅读全文
posted @ 2008-09-19 13:16 Birdshover 阅读(7022) 评论(8) 推荐(2) 编辑
摘要:本节介绍了Field的boost如何设置,以及如何有效调整权重的一些经验之谈。 阅读全文
posted @ 2008-09-09 18:06 Birdshover 阅读(6570) 评论(21) 推荐(5) 编辑
摘要:本节从感性入手,从实验上分析,权重增长多少合适,增长会对其他文档得分产生什么样的影响。 阅读全文
posted @ 2008-09-06 00:54 Birdshover 阅读(6517) 评论(5) 推荐(0) 编辑
摘要:本节开始介绍,索引中设置权重对于搜索结果的影响,内容可能需要持续几节。将主要讲述,设置权重的最小量是多少比较好;分别用Field与Document设置权重的;多Field搜索时权重又会起到什么样的最用。这个话题太大了,冷汗一下。 阅读全文
posted @ 2008-09-05 22:40 Birdshover 阅读(7789) 评论(11) 推荐(3) 编辑
摘要:本节详细介绍了索引过程中,不同的Field配置会产生的各种情况。 阅读全文
posted @ 2008-09-03 22:27 Birdshover 阅读(9043) 评论(8) 推荐(2) 编辑
摘要:本节介绍了Lucene.Net索引过程中的核心类,以及数据的流动路线。 阅读全文
posted @ 2008-09-02 01:45 Birdshover 阅读(9539) 评论(13) 推荐(6) 编辑
摘要:本节简单介绍了索引是什么?为什么要索引?以及Lucene.Net的逻辑存储结构。后面的小节将会围绕怎么索引展开。 阅读全文
posted @ 2008-09-01 02:13 Birdshover 阅读(11224) 评论(17) 推荐(5) 编辑
摘要:作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。 阅读全文
posted @ 2008-08-31 05:33 Birdshover 阅读(7277) 评论(12) 推荐(2) 编辑
摘要:本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。 阅读全文
posted @ 2008-08-31 00:51 Birdshover 阅读(9866) 评论(34) 推荐(2) 编辑
摘要:本节介绍了StandardAnalyzer分词器如何使用能达到我们的目的,原来StandardAnalyzer分词器也不是我们想的那么差啊! 阅读全文
posted @ 2008-08-29 22:32 Birdshover 阅读(8530) 评论(18) 推荐(2) 编辑
摘要:本篇介绍了Lucene.Net内置分词器的整体结构,和调用的流程。接着介绍了如何写最简单的分词器。 阅读全文
posted @ 2008-08-29 02:21 Birdshover 阅读(8111) 评论(15) 推荐(1) 编辑
摘要:本篇介绍Lucene.Net的分词过程,分析最懒惰的什么也不做的KeywordAnalyzer分词器和只用空格分词的WhitespaceAnalyzer分词器。然后粗略得到Lucene.Net的分词流程和如何简单的分词,这些是自己写分词器的基础。 阅读全文
posted @ 2008-08-28 23:41 Birdshover 阅读(13446) 评论(22) 推荐(3) 编辑
摘要:本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。 阅读全文
posted @ 2008-08-27 00:33 Birdshover 阅读(14667) 评论(36) 推荐(4) 编辑
摘要:Lucene.Net 2.3.1开发介绍 —— 简介 Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net Lucene.Net 2.3.1开发介绍 —— 二、分词(一) 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。Lucene.Net 2.3.1开发介绍 —— 二、分词(二) 本篇介绍Lucene.Net的分词过程,分析最懒惰的... 阅读全文
posted @ 2008-08-26 23:20 Birdshover 阅读(19506) 评论(18) 推荐(9) 编辑