向量数据库
随着LLM的起飞,向量数据库也跟着火爆,好多做向量数据库的初创企业ppt刚写好,就拿到几千万美元的风投。
向量数据库是一种特殊的数据库,它是存储了一堆浮点数,这些浮点数排列到一起就像一个数组,这些浮点数在向量数据库里面被称为维度,通过这些维度向量数据库可以存储和检索海量的高维数据,支持复杂查询和分析操作。
向量数据库的工作流程如图1:
向量数据库的核心就是把文本,图片,视频等通过二维、三维、更高维的方式进行编码,生成一系列向量值,然后通过通过向量值计算相似度找到最符合要求的数据,常见的相似度欧式距离和余弦相似度。
欧式距离公式: