摘要: 实施语义缓存以改进 RAG 系统 1.缓存介绍 在本笔记本中,我们将探索一个典型的 RAG 解决方案,其中我们将使用开源模型和向量数据库 Chroma DB。但是,我们将集成一个语义缓存系统,该系统将存储各种用户查询,并决定是否生成包含来自向量数据库或缓存的信息的提示。 语义缓存系统旨在识别相似或相 阅读全文
posted @ 2024-11-28 16:06 bonelee 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 比较 RAG 第 1 部分:块大小分割实验 我探索了 RAG 模型中的各种块大小,并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知,检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。 在这个实验中,我采用了BGE作为嵌入技术(它在 HuggingFace 的 阅读全文
posted @ 2024-11-28 14:37 bonelee 阅读(23) 评论(0) 推荐(0) 编辑