如何将文本转换为向量?(方法三)
文本转换为向量有多种方式:
方法一:
(推荐)方法二:
方法三:
方法四:
本文介绍方法三:如何通过
将文本转换为向量,并入库至向量检索服务DashVector中进行向量检索。前提条件
-
DashVector:
-
已创建Cluster:
-
已获得API-KEY:
-
已安装最新版SDK:
-
-
Jina AI
-
已获得API密钥:
-
Jina Embeddings v2模型
简介
Jina Embeddings v2模型,唯一支持 8192 个词元长度的开源向量模型,在大规模文本向量化基准 (MTEB) 的功能和性能方面与 OpenAI 的闭源模型 text-embedding-ada-002 相当。
模型名称 |
向量维度 |
度量方式 |
向量数据类型 |
备注 |
jina-embeddings-v2-small-en |
512 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-en |
768 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-zh |
768 |
Cosine |
Float32 |
|
说明
关于Jina Embeddings v2模型更多信息请参考:
使用示例
说明
需要进行如下替换代码才能正常运行:
-
DashVector api-key替换示例中的{your-dashvector-api-key}
-
DashVector Cluster Endpoint替换示例中的{your-dashvector-cluster-endpoint}
-
Jina AI api-key替换示例中的{your-jina-api-key}
Python示例:
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· 【.NET】调用本地 Deepseek 模型
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库