11 2024 档案

摘要:实施语义缓存以改进 RAG 系统 1.缓存介绍 在本笔记本中,我们将探索一个典型的 RAG 解决方案,其中我们将使用开源模型和向量数据库 Chroma DB。但是,我们将集成一个语义缓存系统,该系统将存储各种用户查询,并决定是否生成包含来自向量数据库或缓存的信息的提示。 语义缓存系统旨在识别相似或相 阅读全文
posted @ 2024-11-28 16:06 bonelee 阅读(55) 评论(0) 推荐(0) 编辑
摘要:比较 RAG 第 1 部分:块大小分割实验 我探索了 RAG 模型中的各种块大小,并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知,检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。 在这个实验中,我采用了BGE作为嵌入技术(它在 HuggingFace 的 阅读全文
posted @ 2024-11-28 14:37 bonelee 阅读(155) 评论(0) 推荐(0) 编辑
摘要:针对前面RAG测试的长文本问题,我又增加了长文本测试(代码同前): context_test_documents = [ # 文档1: AI发展史 (约2500 tokens) """ 人工智能的发展历程可以追溯到20世纪50年代。1950年,图灵提出著名的"图灵测试",这被认为是人工智能研究的开端 阅读全文
posted @ 2024-11-20 15:52 bonelee 阅读(61) 评论(0) 推荐(0) 编辑
摘要:前文使用了jina ai v2的模型,接下来我们看看v3版本late chunking的实际效果,为了快速,我直接使用官方的api! # import requests # url = 'https://api.jina.ai/v1/embeddings' headers = { 'Content- 阅读全文
posted @ 2024-11-20 15:50 bonelee 阅读(70) 评论(0) 推荐(0) 编辑
摘要:代码: import os import json import torch import numpy as np import spacy from spacy.tokens import Doc from spacy.language import Language import transfo 阅读全文
posted @ 2024-11-20 11:58 bonelee 阅读(128) 评论(1) 推荐(0) 编辑
摘要:import bisect import logging from typing import Dict, List, Optional, Tuple, Union from llama_index.core.node_parser import SemanticSplitterNodeParser 阅读全文
posted @ 2024-11-19 10:58 bonelee 阅读(102) 评论(0) 推荐(0) 编辑
摘要:李嘉誠 教五年內買車買房. 假設你的月收入只有2000元,你也可以過得很好。我幫你把錢分成五份。第一份600元,第二份400元,第三份300元,第四份200元,第五份500元。 第一份,用來做生活費。這麼少的生活費,每天只能夠分到十幾元。早餐一份煮米絲,一個雞蛋,一杯豆漿。中餐一份快餐,一個水果。晚 阅读全文
posted @ 2024-11-18 10:07 bonelee 编辑

点击右上角即可分享
微信分享提示