eaglet

本博专注于基于微软技术的搜索相关技术
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2008年11月17日

摘要: 1.4.2 版本是 1.4 正式版,该版本修改了 1.4.1 版本的一下错误。 阅读全文

posted @ 2008-11-17 13:54 eaglet 阅读(3727) 评论(55) 推荐(0) 编辑

2008年11月6日

摘要: 32位Windows操作系统下单个进程的用户模式内存访问的限制是2G,如果在boot.ini中设置了/3G开关,则最大为3G,超过3G将无法访问。由于Hubble.net 项目是一个数据库系统,必须要考虑使用大内存缓存数据的问题,于是最近对这个问题进行了一些研究。其实这块的技术是现成的,32位操作系统下只有通过 AWE的方式来扩展内存。这块的文章也很多,但很少有.net 下如何使用的实例,我做了一个类似MemoryStream的封装,可以让.Net程序员轻松操作AWE内存,从而使其程序轻松突破2G内存的限制。 阅读全文

posted @ 2008-11-06 14:00 eaglet 阅读(10234) 评论(17) 推荐(2) 编辑

2008年11月3日

摘要: 很多文章提到 Lucene.Net RangeQuery 的查询效率非常低下,我今天测试了一下,果然非常低下,而且结果也不正确。 阅读全文

posted @ 2008-11-03 12:07 eaglet 阅读(2536) 评论(11) 推荐(0) 编辑

2008年10月28日

摘要: Hubble.Net 全文数据库开源项目是一个建立在 .net 框架基础上的由中国程序员主导的全文数据检索开源项目。项目旨在为全文检索开发者或用户提供一个简单易用、高性能、高可用性的全文数据库中间件。Hubble.Net的骨干版本提供最基本的全文检索接口和界面,并被设计为高度可扩展的系统架构,以吸引众多的开发者参与进系统扩展功能的研发和推广,最终形成一套较为完整的全文检索解决方案。 阅读全文

posted @ 2008-10-28 09:09 eaglet 阅读(5435) 评论(38) 推荐(2) 编辑

2008年10月23日

摘要: 做分词组件时,有网友提出采用Hashtable 数据结构查找字符串效率较低,建议改为Dictionary,其理由是采用Hashtable 时Key值是object 会触发装箱和拆箱动作,一直对这种说法表示怀疑,因为我理解只有值类型和引用类型通过object 互转时才会发生装箱和查询,引用类型之间强制转换不应发生装箱和拆箱,而Dictionary 泛型实际上底层还是调用的Hashtable,所以效率怎么会比Hashtable 要高呢?今天决定对比较常用的4种数据结构做一个测试,以便以后做系统性能优化时做一个参考。 阅读全文

posted @ 2008-10-23 14:42 eaglet 阅读(12434) 评论(26) 推荐(2) 编辑

2008年10月17日

摘要: 前几天看到一篇关于.net动态编译的文章 .NET中的动态编译 ,很受启发。在此基础上我做了一些封装,为使调用更加简单,并增加了对动态代码调试的支持,相同代码只编译一次的支持,代码改动自动重新编译,代码引用文件的自动加载和手工加载等功能。 阅读全文

posted @ 2008-10-17 13:10 eaglet 阅读(13759) 评论(27) 推荐(3) 编辑

2008年10月10日

摘要: KTDictSeg 1.4.01 版本经过一段时间的紧张开发,今天正式发布。感谢这段时间一直关心这个项目的朋友们。希望我的工作能给大家带来快乐。 阅读全文

posted @ 2008-10-10 07:56 eaglet 阅读(6147) 评论(66) 推荐(1) 编辑

2008年10月9日

摘要: 对于数据库的分页,目前比较传统的方法是采用分页存储过程,其实用 DataReader 也可以实现分页,不需要写存储过程,实现效率上也比几种比较流行的分页方法要略快。 阅读全文

posted @ 2008-10-09 10:02 eaglet 阅读(6130) 评论(23) 推荐(1) 编辑

2008年10月2日

摘要: 盘古分词开发了多元分词算法,其与lucene.net 配合构建全文搜索,经测试准确度接近google和baidu的水平。现将一些实现方法和测试结果公布出来,供关心分词和搜索技术的朋友们参考。 阅读全文

posted @ 2008-10-02 16:34 eaglet 阅读(25103) 评论(35) 推荐(5) 编辑

2008年9月26日

摘要: .Net framework提供了TreeView 控件,但该控件不支持三态的形式。所谓三态就是带CheckBox的TreeView每个Node都有三种状态,即选中,未选中和部分选中(指该Node的字节点并非全部选中)。 阅读全文

posted @ 2008-09-26 11:46 eaglet 阅读(7002) 评论(11) 推荐(0) 编辑