随笔档案「2024年11月」 - bonelee

实施语义缓存以改进 RAG 系统

摘要：实施语义缓存以改进 RAG 系统 1.缓存介绍在本笔记本中，我们将探索一个典型的 RAG 解决方案，其中我们将使用开源模型和向量数据库 Chroma DB。但是，我们将集成一个语义缓存系统，该系统将存储各种用户查询，并决定是否生成包含来自向量数据库或缓存的信息的提示。语义缓存系统旨在识别相似或相阅读全文

posted @ 2024-11-28 16:06 bonelee 阅读(249) 评论(0) 推荐(0)

RAG实验：块大小分割实验、矢量存储；FAISS 与 Chroma、向量存储和 Top k、向量存储中的距离度量

摘要：比较 RAG 第 1 部分：块大小分割实验我探索了 RAG 模型中的各种块大小，并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知，检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。在这个实验中，我采用了BGE作为嵌入技术（它在 HuggingFace 的阅读全文

posted @ 2024-11-28 14:37 bonelee 阅读(731) 评论(0) 推荐(0)

RAG中late chunking的实验效果测试（续2）

摘要：针对前面RAG测试的长文本问题，我又增加了长文本测试（代码同前）： context_test_documents = [ # 文档1: AI发展史 (约2500 tokens) """ 人工智能的发展历程可以追溯到20世纪50年代。1950年，图灵提出著名的"图灵测试"，这被认为是人工智能研究的开端阅读全文

posted @ 2024-11-20 15:52 bonelee 阅读(159) 评论(0) 推荐(0)

RAG中late chunking的实验效果测试（续）

摘要：前文使用了jina ai v2的模型，接下来我们看看v3版本late chunking的实际效果，为了快速，我直接使用官方的api！ # import requests # url = 'https://api.jina.ai/v1/embeddings' headers = { 'Content- 阅读全文

posted @ 2024-11-20 15:50 bonelee 阅读(178) 评论(0) 推荐(0)

RAG中late chunking的实验效果测试

摘要：代码： import os import json import torch import numpy as np import spacy from spacy.tokens import Doc from spacy.language import Language import transfo 阅读全文

posted @ 2024-11-20 11:58 bonelee 阅读(303) 评论(1) 推荐(0)

late chunking 源码分析-https://github.com/jina-ai/late-chunking

摘要：import bisect import logging from typing import Dict, List, Optional, Tuple, Union from llama_index.core.node_parser import SemanticSplitterNodeParser 阅读全文

posted @ 2024-11-19 10:58 bonelee 阅读(520) 评论(0) 推荐(0)

李嘉誠教五年內買車買房

摘要：李嘉誠教五年內買車買房. 假設你的月收入只有2000元，你也可以過得很好。我幫你把錢分成五份。第一份600元，第二份400元，第三份300元，第四份200元，第五份500元。第一份，用來做生活費。這麼少的生活費，每天只能夠分到十幾元。早餐一份煮米絲，一個雞蛋，一杯豆漿。中餐一份快餐，一個水果。晚阅读全文

posted @ 2024-11-18 10:07 bonelee

将者，智、信、仁、勇、严也。

Hi，我是李智华，华为-安全AI算法专家，欢迎来到安全攻防对抗的有趣世界。

11 2024 档案

公告