eaglet

本博专注于基于微软技术的搜索相关技术
随笔 - 189, 文章 - 0, 评论 - 3725, 阅读 - 147万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

Hubble.net V0.2 版本正式生成

Posted on   eaglet  阅读(999)  评论(12编辑  收藏  举报

Hubble.net V0.2 版本正式生成

 Author: eaglet

    Hubble.net V0.2 版本历时将近半年时间,终于全部结束,期间走了一些弯路,耽误了一些时间。

    V0.2 版本是Hubble.net 的一个重要基石,该版本完成了一下功能和改进

    1.文件索引

    完成了将倒排索引持久化到文件的功能。

    2.元数据索引

    可以对一些类似价格,数量之类的原数据进行索引。

    3. 数据存储功能

    通过和数据库关联,将表格的原始数据存储到数据库中,并通过唯一的DocId 和索引文件进行关联。

    4. 索引级别缓存

    完成了索引级别的缓存设计,对应字串的倒排索引第一次加载后将驻留在内存中,直到内存超过系统指定阀值,或手动强制回收。

    5. 多线程支持

    支持多线程同时插入和查询。同时插入和查询时不会产生任何冲突。

    6. 重建

    提供了Create 方法和Drop方法,用于新建和删除表格(Table)。

    7. 增量索引

    索引后可以进行增量,增量时自动更新索引级别缓存。

    8. 优化的倒排索引查询的效率

    采用了一些优化技术将倒排索引的查询速度在V0.1版本的基础上又提高了3倍左右。

    下载地址

    Hubble.net V0.2

 

 

 

编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述
历史上的今天:
2008-05-27 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 分词粒度
点击右上角即可分享
微信分享提示