向量搜索技术:基于Elasticsearch/PostgreSQL/Redis扩展的向量搜索数据库或独立向量搜索引擎方案参考
理论基础与研究
向量数据库用于非结构化文本、图片、音频、视频搜索、推荐,将他们转换为数字向量表示来进行相似性(ANN)搜索。存储和搜索高维向量是其特征之一,通常采用高级索引技术和算法如HNSW, Annoy, 或Faiss来实现。不同于SQL数据库,向量数据库更像nosql,用户接受使用sdk/API来执行搜索(虽然这个声明式不如SQL强大)。
向量数据库使用的底层搜索、索引技术和推荐系统中的向量召回是高度重合的。
星环科技向量数据库从 0 到 1 技术实践:提升数据处理的精确度是重中之重
OpenAI体验3 —— embedding和向量数据库(pinecone)
AI 原生向量数据库 : 大模型的“黄金搭档”, 能提供“记忆海绵”
「向量召回」相似检索算法——HNSW(pg_embedding使用的就是HNSW算法)
深入浅出推荐系统(四):召回:向量化的潮流(重点讲embedding)
搜索召回 | Facebook: 亿级向量相似度检索库Faiss原理+应用
AI行业专题报告:向量数据库,AI时代的Killer App
langchain(3)—向量数据库调研及简单性能测试(包括测试数据集,建模方法)
向量数据库排名
https://byby.dev/vector-databases
https://github.com/topics/vector-database
https://press.ai/best-vector-databases/#
综合github/国外排名/国内分析来看,开源中基于es,faiss,milvus的方案比较有较大竞争力。
基于ElasticSearch的方案参考
向量数据库:使用Elasticsearch实现向量数据存储与搜索
基于postgresql的方案参考
基于redis的参考方案
milvus方案
召回技术(向量检索工具faiss篇) milvus基于faiss库
云原生向量数据库Milvus(一)-简述、系统架构及应用场景(下)
基于GPT3.5实现本地知识库解决方案-利用向量数据库和GPT向量接口-实现智能回复并限制ChatGPT回答的范围
OpenAI-ChatGPT嵌入向量式文本转换接口
https://www.rstk.cn/news/167704.html?action=onClick
https://zhuanlan.zhihu.com/p/635153849?utm_id=0
https://blog.51cto.com/u_15588078/6531147
https://mp.weixin.qq.com/s/NnQTeJgiFyJzc38Wk_bCHQ
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)