我发起了一个 .Net 平台上的 开源项目 知识图谱 Babana Map 和 文本文件搜索引擎 Babana Search
起因 也是 前几天 有 网友 在 群 里发了 知识图谱 相关的文章,
还有 有 网友 问起 NLog -> LogStash -> Elastic Search 的 问题,
所以, 像 Elastic Search 这样的, 应该算是一个 文本文件搜索引擎,
我觉得 我们 写一个 文本文件搜索引擎 也没什么问题 。
文本文件搜索引擎 是 粗粒度的 、 松散的 数据存储检索 系统 。
数据 可以存放在 任意 的 文件 里, 文件 的 大小 是 任意的(可以存放任意数量的数据条目), 文件 的 数量 是 任意的, 文件 的 位置 是 任意的(可以是 不同的 文件夹 和 服务器) 。
文本文件搜索引擎 需要 的 技术 如下 :
1 文本分析(字符串分析), 可以参考 《SelectDataTable》 https://www.cnblogs.com/KSongKing/p/9455216.html ,
2 大规模并行计算, 可以参考 《.Net Core 应用方向 图谱》 https://www.cnblogs.com/KSongKing/p/10209880.html ,
3 数据存储 检索技术, 可以参考 《我发起了一个 .Net 平台上的 NewSql 数据库 BabanaDB》 https://www.cnblogs.com/KSongKing/p/10255420.html ,
但是 文本文件搜索引擎 和 NewSql 数据库 是 有区别 的 。
传统的 关系数据库 和 NewSql 数据库 都是 紧密的 、 严格的 、 用于 实时交易 的 数据库 。
知识图谱 应该是 在 文本文件搜索引擎 上 发展出来的 一些 高级功能 。
文本文件搜索引擎 是 大规模并行计算 的 代表性应用 。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!