摘要: UtilUtil包含一些数据结构如BitVector 和PriorityQueue,具体的说明如下表所示:类名说明Arrays一个关于数组的排序方法的静态类,提供了优化的基于快排序的排序方法sortBitVectorC/C++语言中位域的C#实现Number一个数字字母的转化类,定义了ToString()以及Parse()方法PriorityQueue一个优先队列的抽象类,用于后面实现各种具体的优... 阅读全文
posted @ 2010-11-28 15:19 Anders.Lee 阅读(221) 评论(0) 推荐(0) 编辑
摘要: StoreStore里主要是一些对文件的操作类。其主要目的是抽象出和平台文件系统无关的存储抽象,提供诸如目录服务(增、删文件)、输入流和输出流。主要的类的结构为:抽象类Directory类,InputStream类和OutputStream类。其中FSDirectory,RAMDirectory继承了Directory抽象类,FSInputStream,RAMInputStream继承了Input... 阅读全文
posted @ 2010-11-28 15:18 Anders.Lee 阅读(261) 评论(0) 推荐(0) 编辑
摘要: IndexØ Term is <fieldName, text>Ø index maps Term → <df, <docNum, <position>* >*>Ø e.g., “content:pisa” → <2, <2, <14>>, &... 阅读全文
posted @ 2010-11-28 15:17 Anders.Lee 阅读(161) 评论(0) 推荐(0) 编辑
摘要: SearchØ primitive queries: TermQuery: match docs containing a TermPhraseQuery: match docs w/ sequence of TermsBooleanQuery: match docs matching other queries.e.g., +path:pisa +content:“Doug... 阅读全文
posted @ 2010-11-28 15:16 Anders.Lee 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 今天整理草稿箱时发现了N年前准备的NLucene系列草稿,由于长时间没能登录,自己有比较懒散没有整理,哎!现在先补上作业,发布出来,以后找时间进一步完善。 阅读全文
posted @ 2010-11-28 15:01 Anders.Lee 阅读(118) 评论(0) 推荐(0) 编辑
摘要: QueryParser本模块主要的功能是用来接收查询语句,将其解析成对象以便于搜索BNF范式为:Query ::= ( Clause )*Clause ::= ["+", "-"] [<TERM> ":"] ( <TERM> | "(" Query ")") 阅读全文
posted @ 2010-11-28 14:51 Anders.Lee 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 午夜无眠,随手翻到CLR hosting的章节,于是记下一些心得。。首先是CLR被MS实现成一个COM(MSCorWks.dll中),GUIDs还有接口ICLRRuntimeHost定义在MSCorEE.h中,在于是好奇在SDK中找到打开看看,乖乖,上万行,汗!对应的MSCorEE.dll在System32下,它其实不实现CLR,只是个跑龙套的(shim),即便一台机器中装有多个版本的CLR,也只... 阅读全文
posted @ 2010-11-27 01:47 Anders.Lee 阅读(482) 评论(1) 推荐(0) 编辑
摘要: 项目一直很忙,长时间没有来园子,结果密码忘记了:( 更不巧的是原来设置的信箱也无法登录,尝试了好几次都不成功。。。今天抱着试试看的心态,轮番尝试了自己常用的几个密码,结果居然进来啦,嘎嘎~~不幸中的万幸! 也算是一个鼓励,以后可要勤快些,经常来更新啰 阅读全文
posted @ 2010-11-06 00:15 Anders.Lee 阅读(178) 评论(0) 推荐(0) 编辑
摘要: winver---------检查Windows版本 wmimgmt.msc----打开windows管理体系结构(WMI) wupdmgr--------windows更新程序 wscript--------windows脚本宿主设置 write----------写字板 winmsd---------系统信息 wiaacmgr-------扫描仪和照相机向导 winchat--------XP... 阅读全文
posted @ 2006-12-18 11:39 Anders.Lee 阅读(1968) 评论(0) 推荐(0) 编辑
摘要: AnalysisAnalysis模块主要提供了文本解析的功能,输入为TextReader的字符流,最终解析成TokenStream形式的结果返回给调用端。由前文的NLucene架构图可以看出,Analysis主要为Index和QueryParser模块提供解析服务,分别是在Indexing原始文件和解析搜索语句中的Term的过程中。要了解这个包,首先需要明确几个概念:Ø Token:&#... 阅读全文
posted @ 2006-12-15 23:47 Anders.Lee 阅读(555) 评论(1) 推荐(0) 编辑