11 2024 档案
摘要:实施语义缓存以改进 RAG 系统 1.缓存介绍 在本笔记本中,我们将探索一个典型的 RAG 解决方案,其中我们将使用开源模型和向量数据库 Chroma DB。但是,我们将集成一个语义缓存系统,该系统将存储各种用户查询,并决定是否生成包含来自向量数据库或缓存的信息的提示。 语义缓存系统旨在识别相似或相
阅读全文
摘要:比较 RAG 第 1 部分:块大小分割实验 我探索了 RAG 模型中的各种块大小,并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知,检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。 在这个实验中,我采用了BGE作为嵌入技术(它在 HuggingFace 的
阅读全文
摘要:针对前面RAG测试的长文本问题,我又增加了长文本测试(代码同前): context_test_documents = [ # 文档1: AI发展史 (约2500 tokens) """ 人工智能的发展历程可以追溯到20世纪50年代。1950年,图灵提出著名的"图灵测试",这被认为是人工智能研究的开端
阅读全文
摘要:前文使用了jina ai v2的模型,接下来我们看看v3版本late chunking的实际效果,为了快速,我直接使用官方的api! # import requests # url = 'https://api.jina.ai/v1/embeddings' headers = { 'Content-
阅读全文
摘要:代码: import os import json import torch import numpy as np import spacy from spacy.tokens import Doc from spacy.language import Language import transfo
阅读全文
摘要:import bisect import logging from typing import Dict, List, Optional, Tuple, Union from llama_index.core.node_parser import SemanticSplitterNodeParser
阅读全文
摘要:李嘉誠 教五年內買車買房. 假設你的月收入只有2000元,你也可以過得很好。我幫你把錢分成五份。第一份600元,第二份400元,第三份300元,第四份200元,第五份500元。 第一份,用來做生活費。這麼少的生活費,每天只能夠分到十幾元。早餐一份煮米絲,一個雞蛋,一杯豆漿。中餐一份快餐,一個水果。晚
阅读全文