架构深渊

慢慢走进程序的深渊……关注领域驱动设计、测试驱动开发、设计模式、企业应用架构模式……积累技术细节,以设计架构为宗。
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2008年11月24日

摘要: Code Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->lucene.net索引文件存储简析2007年12月03日 星期一 下午 05:53在lucene.net中,典型的索引文件操作代码如下: IndexWriter writer = new In... 阅读全文

posted @ 2008-11-24 15:49 chen eric 阅读(558) 评论(0) 推荐(0) 编辑

摘要: 2008年02月22日 星期五 下午 09:04 Lucene是有名的开源搜索框架,具体细节自己查。对于英文来说,其对分词的处理已经比较不错,但是对于日文,中文等的处理太差,所以对我们中文来说,分词是瓶颈。因为不是按照间隔区分“词汇”的,我才接触,到项目中,使用,已经是快一年了,因为自己很喜欢c#,所以,一直就关注的是LUCENE.NE... 阅读全文

posted @ 2008-11-24 15:47 chen eric 阅读(313) 评论(0) 推荐(0) 编辑

摘要: Code Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->lucene.net 搜索及分页2008-10-21 23:20整理下lucene.net 搜索及分页代码(可扩展为可缓存,有快照的小型搜索引擎) 已测 using System; using... 阅读全文

posted @ 2008-11-24 13:40 chen eric 阅读(788) 评论(1) 推荐(0) 编辑

摘要: 1, 有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆分成多个包含部分Field... 阅读全文

posted @ 2008-11-24 13:23 chen eric 阅读(339) 评论(0) 推荐(0) 编辑