几款不同AI向量数据库对比感受
最近在学习跟AI相关,说到AI,自然避免不了要使用到向量数据库,今天我就拿市面上几款向量数据库做下对比,也来谈下自己粗浅的感受吧。
Google上对向量数据库的解释如下,
向量数据库是一种专门用于存储和查询向量数据的数据库系统,与传统数据库相比,向量数据库使用向量化计算,能够高速地处理大规模的复杂数据;并可以处理高维数据,例如图像、音频和视频等,解决传统关系型数据库中的痛点;同时,向量数据库支持复杂的查询操作,也可以轻松地扩展到多个节点,以处理更大规模的数据。
其实我们普通人简单理解:向量数据库是专为AI量身打造,比传统数据库更擅长图像、音频、视频数据处理。
四款向量数据库,分别为:Pinecone、Qdrant、Chroma、和Milvus。其中除了Pinecone,其它三款均为开源。其中前三款是国外的,最后一款Milvus是国产的,我查询了下,是上海一家企业开发的。赞!
Pinecone官方网页
今天我们主要对比这三款开源的。
首先从社区活跃度和人气度来看,
Qdrant在github上目前有11.6K star,最近一次更新是3星期前。
Chroma在github上目前有7K star,最近一次更新是一星期前。
Milvus在github上目前有21.1K star,最近一次更新是一星期前。
从人气和社区活跃度上看,这款国产的Milvus向量数据库,毫无疑问地绝对的第一。
我们再来从用户使用体验上看下。
Qdrant官网
Qdrant提供了四种安装方法,分别是:Docker、From source、Python client和Kubernetes,最后这个Kubernetes其实我不也不清楚是什么。
使用也很简单,
Chroma支持两种安装方式,分别是python和javascript,
我采用的是python安装。
不知道怎么回事,我开始先在windows下安装,总是出现兼容包问题。而更换到Ubuntu下安装,很容易就安装成功。
Chroma的使用也很简单,如上图,几句简单的调用直接便可以使用。
Chroma部署在AWS上也很简单,按照其最低要求至少2G内存,AWS上大概是15刀每月。
看下Milvus
Milvus支持Docker安装,方法也很简单,如下图操作,
Milvus提供AWS Cloud和Google Cloud接入,类似阿里云数据库那种,只需要修改uri和token key即可。
提供三种版本供用户选择,分别为免费版、标准版和企业版。
其中免费版貌似只支持一个Cluster,标准版65刀每月,企业版99刀每月,新用户提供100刀一个月的免费券。
支持REST ful API、Python、NodeJS、JAVA。
除此之外,Milvus还提供类似web UI Query界面,可以很方便地直接在上边操作查询,有点像我们使用传统数据库查询工具那种。
我尝试用java在本地测试了下,感受不错。
总体讲,Milvus提供的支持和服务更为全面,Chroma和Qdrant的文档和技术支持差不多,Chroma更为轻量级,便于很快部署,对配置要求也不是很高,有点想sql lite那种,很容易上手,非常适合新手或创业者。
Milvus唯一的缺点,就是价格方面不太亲民,即便是标准版也需要65刀美金,而这个价格,已经可以够Chroma在AWS上购买四个多月的服务支持了。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
2022-06-13 2022 闲置电脑显卡快速挖矿,纯新手教程(ETH,RVN,ERG)——todo,待实践
2018-06-13 leetcode 119. Pascal's Triangle II
2018-06-13 leetcode 110. Balanced Binary Tree
2018-06-13 leetcode 232. Implement Queue using Stacks
2017-06-13 搜索引擎——用户搜索意图的理解及其难点解析,本质是利用机器学习用户的意图分类
2017-06-13 深入浅出时序数据库之预处理篇——批处理和流处理,用户可定制,但目前流行influxdb没有做
2017-06-13 FreeWheel基于Go的实践经验漫谈——GC是大坑(关键业务场景不用),web框架尚未统一,和c++性能相比难说