我发起了一个 .Net 平台上的 开源项目 知识图谱 Babana Map 和 文本文件搜索引擎 Babana Search

起因 也是 前几天 有 网友 在 群 里发了   知识图谱   相关的文章,

还有 有 网友 问起   NLog -> LogStash -> Elastic Search  的 问题,

 

所以, 像 Elastic Search 这样的, 应该算是一个 文本文件搜索引擎,

我觉得 我们 写一个 文本文件搜索引擎 也没什么问题 。

 

文本文件搜索引擎  是  粗粒度的 、 松散的   数据存储检索  系统 。

数据 可以存放在 任意 的 文件 里, 文件 的 大小 是 任意的(可以存放任意数量的数据条目), 文件 的 数量 是 任意的, 文件 的 位置 是 任意的(可以是 不同的 文件夹 和 服务器) 。

 

文本文件搜索引擎 需要 的 技术 如下 :

1  文本分析(字符串分析),  可以参考 《SelectDataTable》  https://www.cnblogs.com/KSongKing/p/9455216.html    ,

2  大规模并行计算,  可以参考 《.Net Core 应用方向 图谱》  https://www.cnblogs.com/KSongKing/p/10209880.html    ,

3  数据存储 检索技术,  可以参考 《我发起了一个 .Net 平台上的 NewSql 数据库 BabanaDB》  https://www.cnblogs.com/KSongKing/p/10255420.html    ,

 

但是 文本文件搜索引擎 和 NewSql 数据库 是 有区别 的 。

传统的 关系数据库 和 NewSql 数据库 都是   紧密的 、 严格的 、 用于 实时交易 的 数据库 。

 

知识图谱 应该是 在 文本文件搜索引擎 上 发展出来的 一些 高级功能 。

文本文件搜索引擎 是 大规模并行计算 的 代表性应用 。

 

 

posted on   凯特琳  阅读(423)  评论(0编辑  收藏  举报

编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示