08 2008 档案
摘要:作为分词在一个阶段的结束篇,总感觉有点虎头蛇尾的味道。而如果现在讲基于词库,语言方面的分词感觉还是早了点,因此,这里就匆匆收笔,准备进入索引部分的探索。本节主要对比了一下Lucene.Net2.1前版和2.3.1版本在分词上的一个最主要的差别, 介绍了怎么修改。然后简单分析了下二元分词的优点和不足。
阅读全文
摘要:本节介绍了如何开发自己的分词器,介绍了二元分词器的开发。因为版本的更新,需要对一些地方进行修改,下一节会对版本更新后导致问题做一个大致的分析。
阅读全文
摘要:本节介绍了StandardAnalyzer分词器如何使用能达到我们的目的,原来StandardAnalyzer分词器也不是我们想的那么差啊!
阅读全文
摘要:本篇介绍了Lucene.Net内置分词器的整体结构,和调用的流程。接着介绍了如何写最简单的分词器。
阅读全文
摘要:本篇介绍Lucene.Net的分词过程,分析最懒惰的什么也不做的KeywordAnalyzer分词器和只用空格分词的WhitespaceAnalyzer分词器。然后粗略得到Lucene.Net的分词流程和如何简单的分词,这些是自己写分词器的基础。
阅读全文
摘要:本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。
阅读全文
摘要:Lucene.Net 2.3.1开发介绍 —— 简介 Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net Lucene.Net 2.3.1开发介绍 —— 二、分词(一) 本篇介绍了如何测试分词器的效果,并且简单测试了一下Lucene.Net内置分词器的效果。Lucene.Net 2.3.1开发介绍 —— 二、分词(二) 本篇介绍Lucene.Net的分词过程,分析最懒惰的...
阅读全文
摘要:1、引用Lucene.Net类库找到Lucene.Net的源代码,在“C#\src\Lucene.Net”目录。打开Visual Studio,我的版本是2008,而Lucene.Net默认的是2005。先创建一个项目,简单起见,创建一个C#控制台程序。 图 1.1 然后添加Lucene.Net进项目,如图 1.2 - 1.3。 图 1.2图 1.3 这个过程要进行一个VS2005到2008的转换...
阅读全文
摘要:首先,你需要一个svn客户端。TortoiseSVN非常好用,可以从官方网站下载。下载地址:http://tortoisesvn.net/downloads。下载完成,就安装,需要重启电脑。然后在d盘下建立一个空文件夹,命名为Lucene.Net。打开文件夹,右键,则出现菜单。如图"附录一 1"。 附录一 1 发现多了两项,分别是SVN Checkout和TortoiseSVN。点“SVN Che...
阅读全文
摘要:Lucene.Net是Lucene在dot net平台上的移植版本。它的功能与Lucene一样,都是用来提供一组API,让我们能快速开发自己的搜索引擎,当然,是全文搜索。它不是一个程序,拿到它并不能立刻运行,你必须自己实现逻辑过程。这是一个和.Net Framework一样的框架。Lucene是用Java写的,尔后衍生出Nutch,接着又衍生出Hadoop。这些可以说和Lucen...
阅读全文
摘要:在使用Lucene的过程中,对Lucene的工作方式产生了越来越浓厚的兴趣。于是尝试阅读其中所有的类,整理其内部结构关系,以期能理解Lucene。
阅读全文
摘要:假如变量的值 i = int.MaxValue;这个时候运行;Console.WriteLine(++i);输出什么?其他书上也有讲,只是可能没有讲这么多废话。
阅读全文
摘要:这样就总结出三种for循环样式
1、for(int i = 0;i 0 || j0 ; i--,j++) //有多表达式的
还有....
阅读全文