HubbleDotNet开源全文搜索数据库项目--技术详解[转]

 

HubbleDotNet 是一个基于.net framework 的开源免费的全文搜索数据库组件。


HubbleDotNet 简介

HubbleDotNet 和 Lucene.net 性能对比测试

安装和升级

   安装

   升级

用户权限--功能规划中

   默认帐号

   添加帐号

   帐号权限

 

索引

   Hubble.net 的数据库和数据表

       Hubble.net 数据表的数据类型

       创建、删除数据库

       创建数据表

       为数据库现有表或视图建立全文索引(一) Append Only 模式

       为数据库现有表或视图建立全文索引(二) Updatable 模式

       为数据库现有表或视图建立全文索引(三) 多表关联全文索引模式

       通过程序和现有表或视图同步

       自动和现有表同步

   倒排索引结构

   倒排索引优化

   UnTokenized 索引

   关系数据库索引

搜索

   搜索的基本流程

   对 Tokenized 字段搜索

       搜索语法

           指定单词权重

           指定字段权重

           指定文档权重

       Match 方式

       Contains 方式

       Like 方式

       组合搜索      

   Tokenized字段和Untokenized 字段组合搜索      

   Tokenized字段和关系数据库索引字段组合搜索      

   多表联合搜索

       同构表的联合搜索 

       异构表的联合搜索 

   编写自己的得分算法

分词器 

      SimpleAnalyzer

      EnglishAnalyzer

      PanGuSegment

      查看指定分词器的分词结果

      查看某个字段对应分词器的分词结果

      查看某条记录某个字段的分词结果

      编写自己的分词器

数据库适配器 

      SQLSERVER 2005

      SQLSERVER 2000

      连接 Oracle 数据库

      编写自己的数据库适配器

 

性能优化 

      各种数据类型占用内存情况

      优化分词器

      查询级别缓存

      查询级别缓存的持久化

      数据级别缓存

      不同搜索方式的性能     

      分布式查询

      执行跟踪报告

          如何让查询分析器输出执行跟踪报告

          如何分析执行跟踪报告

 

测试报告

HubbleDotNet 海量数据测试报告

远程访问

SQLClient

示例

项目应用

 

来源:http://www.cnblogs.com/eaglet/archive/2010/04/07/1706305.html

posted @ 2010-09-03 17:17  guangrou  阅读(218)  评论(1编辑  收藏  举报