摘要: UtilUtil包含一些数据结构如BitVector 和PriorityQueue,具体的说明如下表所示:类名说明Arrays一个关于数组的排序方法的静态类,提供了优化的基于快排序的排序方法sortBitVectorC/C++语言中位域的C#实现Number一个数字字母的转化类,定义了ToString()以及Parse()方法PriorityQueue一个优先队列的抽象类,用于后面实现各种具体的优... 阅读全文
posted @ 2010-11-28 15:19 Anders.Lee 阅读(221) 评论(0) 推荐(0) 编辑
摘要: StoreStore里主要是一些对文件的操作类。其主要目的是抽象出和平台文件系统无关的存储抽象,提供诸如目录服务(增、删文件)、输入流和输出流。主要的类的结构为:抽象类Directory类,InputStream类和OutputStream类。其中FSDirectory,RAMDirectory继承了Directory抽象类,FSInputStream,RAMInputStream继承了Input... 阅读全文
posted @ 2010-11-28 15:18 Anders.Lee 阅读(261) 评论(0) 推荐(0) 编辑
摘要: IndexØ Term is <fieldName, text>Ø index maps Term → <df, <docNum, <position>* >*>Ø e.g., “content:pisa” → <2, <2, <14>>, &... 阅读全文
posted @ 2010-11-28 15:17 Anders.Lee 阅读(161) 评论(0) 推荐(0) 编辑
摘要: SearchØ primitive queries: TermQuery: match docs containing a TermPhraseQuery: match docs w/ sequence of TermsBooleanQuery: match docs matching other queries.e.g., +path:pisa +content:“Doug... 阅读全文
posted @ 2010-11-28 15:16 Anders.Lee 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 今天整理草稿箱时发现了N年前准备的NLucene系列草稿,由于长时间没能登录,自己有比较懒散没有整理,哎!现在先补上作业,发布出来,以后找时间进一步完善。 阅读全文
posted @ 2010-11-28 15:01 Anders.Lee 阅读(118) 评论(0) 推荐(0) 编辑
摘要: QueryParser本模块主要的功能是用来接收查询语句,将其解析成对象以便于搜索BNF范式为:Query ::= ( Clause )*Clause ::= ["+", "-"] [<TERM> ":"] ( <TERM> | "(" Query ")") 阅读全文
posted @ 2010-11-28 14:51 Anders.Lee 阅读(205) 评论(0) 推荐(0) 编辑