eaglet

本博专注于基于微软技术的搜索相关技术
随笔 - 189, 文章 - 0, 评论 - 3725, 阅读 - 147万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

HubbleDotNet开源全文搜索数据库项目--技术详解

Posted on   eaglet  阅读(49054)  评论(180编辑  收藏  举报

HubbleDotNet 简介

HubbleDotNet 和 Lucene.net 性能对比测试

HubbleDotNet 和 Lucene.Net 匹配相关度的比较

HubbleDotNet 软件架构

安装和升级

   安装

   升级

用户权限--功能规划中

   默认帐号**

   添加帐号**

   帐号权限**

   

索引

   Hubble.net 的数据库和数据表

       Hubble.net 数据表的数据类型

       创建、删除数据库

       创建数据表

       为数据库现有表或视图建立全文索引(一) Append Only 模式

       为数据库现有表或视图建立全文索引(二) Updatable 模式

       为数据库现有表或视图建立全文索引(三) 多表关联全文索引模式

       通过程序和现有表或视图同步

       自动和现有表同步

       通过后台任务自动同步或优化索引

       自动与Oracle中的数据同步解析

   内存索引

   倒排索引结构*

   倒排索引优化*

   UnTokenized 索引*

   关系数据库索引*

搜索

   搜索的基本流程*

   HubbleDotNet开源全文搜索数据库项目--查询方法汇总

   对 Tokenized 字段搜索*

       搜索语法*

           指定单词权重

           指定字段权重

           指定文档权重

       Match 方式

       Contains 方式

       Like 方式*

       组合搜索*      

   Tokenized字段和Untokenized 字段组合搜索*      

   Tokenized字段和关系数据库索引字段组合搜索*      

   多表联合搜索*

       同构表的联合搜索

       异构表的联合搜索

   编写自己的得分算法*

分词器 

      SimpleAnalyzer*

      EnglishAnalyzer*

      PanGuSegment*

      HubbleDotNet 索引分词的测试方法和分词技巧

      编写自己的分词器

数据库适配器*

      SQLSERVER 2005

      SQLSERVER 2000

      连接 Oracle 数据库

      HubbleDotNet+Mongodb 构建高性能搜索引擎--概述

      编写自己的数据库适配器*

 

性能优化 

      大量并发访问的解决方案 

      各种数据类型占用内存情况*

      优化分词器*

      查询级别缓存*

      查询级别缓存的持久化*

      数据级别缓存*

      不同搜索方式的性能*     

      分布式查询*

      执行跟踪报告*

          如何让查询分析器输出执行跟踪报告*

          如何分析执行跟踪报告*

分布式查询 

          HubbleDotNet 分布式检索算法介绍 (一)

          HubbleDotNet 分布式检索--异步通讯模式的调用方法

测试报告

      HubbleDotNet 海量数据测试报告

远程访问*

 

SQLClient*

      大量并发访问的解决方案 

      异步通讯模式的调用方法

示例*

 

项目应用*

 

注:

* 为还没有完成的文档
** 为功能目前尚未实现

编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· SQL Server 2025 AI相关能力初探
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
点击右上角即可分享
微信分享提示