wudi

博客园 首页 新随笔 联系 订阅 管理

2013年4月26日 #

摘要: 对于数据量大(索引文件大于50M)的索引,尽量不要用索引中的字段排序,要用索引ID排序(INDEXORDER);两者效率相差近10倍,以下从内存占用与CPU处理时间来比较:内存占用比较: 图一:使用整型的唯一标识字段排序 图二:使用索引ID(INDEXORDER)排序 拿占用内存最多的对象来比较:我们可以看到,图一比图二多 2,900,766 bytes(索引文件大小:61M)处理时间比较: 使用整型的唯一标识字段排序的处理时间是3016ms,使用索引ID(INDEXORDER)排序的时间是303ms解决方法: 为了能够使索引ID倒序等同于时间倒序:在建立索引时,就要按照数据的时间顺序建立.. 阅读全文
posted @ 2013-04-26 15:16 菜鸟吴迪 阅读(671) 评论(0) 推荐(0) 编辑

摘要: http://hi.baidu.com/lewutian/item/6ff16d3c9710adfc97f88d98本文仅记录一些简单的使用方法,供初学者参考。 以下例子采用 Lucene.NET 1.9 版本,可取去 Lucene.Net 下载。1. 基本应用using System; using System.Collections.Generic; using System.Text; using Lucene.Net; using Lucene.Net.Analysis; using Lucene.Net.Analysis.Standard; using Lucene.Net.D... 阅读全文
posted @ 2013-04-26 14:28 菜鸟吴迪 阅读(230) 评论(0) 推荐(0) 编辑

摘要: (转)http://blog.csdn.net/hehui21/article/details/2874113Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。 在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。1 联合两个索引查询,已解决: IndexSearcher[] searchers = new IndexSearcher[2]; searchers[0] = new IndexSearcher(m_indexpath); searchers[1] = new IndexSearcher(m_outindex. 阅读全文
posted @ 2013-04-26 14:23 菜鸟吴迪 阅读(259) 评论(0) 推荐(0) 编辑