摘要: 针对前面RAG测试的长文本问题,我又增加了长文本测试(代码同前): context_test_documents = [ # 文档1: AI发展史 (约2500 tokens) """ 人工智能的发展历程可以追溯到20世纪50年代。1950年,图灵提出著名的"图灵测试",这被认为是人工智能研究的开端 阅读全文
posted @ 2024-11-20 15:52 bonelee 阅读(30) 评论(0) 推荐(0) 编辑
摘要: 前文使用了jina ai v2的模型,接下来我们看看v3版本late chunking的实际效果,为了快速,我直接使用官方的api! # import requests # url = 'https://api.jina.ai/v1/embeddings' headers = { 'Content- 阅读全文
posted @ 2024-11-20 15:50 bonelee 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 代码: import os import json import torch import numpy as np import spacy from spacy.tokens import Doc from spacy.language import Language import transfo 阅读全文
posted @ 2024-11-20 11:58 bonelee 阅读(72) 评论(1) 推荐(0) 编辑
摘要: 最近在做RAG,因为涉及embedding计算,用到了BAAI BGE小模型,但是模型是给python调用的,需要转换为onnx格式给java使用。所以有了下面的探索: python代码: import torch from transformers import AutoTokenizer, Au 阅读全文
posted @ 2024-06-29 11:39 bonelee 阅读(450) 评论(1) 推荐(0) 编辑
摘要: 准备: docker pull docker.elastic.co/elasticsearch/elasticsearch:7.6.2 7.6.2: Pulling from elasticsearch/elasticsearch c808caf183b6: Pull complete d6caf8 阅读全文
posted @ 2024-06-20 16:58 bonelee 阅读(79) 评论(0) 推荐(0) 编辑
摘要: main.py import requests from fastapi import FastAPI, HTTPException, Depends, Request, status, Query from fastapi.middleware.cors import CORSMiddleware 阅读全文
posted @ 2024-06-04 16:50 bonelee 阅读(40) 评论(1) 推荐(0) 编辑
摘要: superAGI.txt You are SuperAGI an AI assistant to solve complex problems. Your decisions must always be made independently without seeking user assista 阅读全文
posted @ 2024-06-03 20:27 bonelee 阅读(42) 评论(0) 推荐(0) 编辑
摘要: 【PPO算法介绍】 PPO(Proximal Policy Optimization)是一种强化学习算法,它的目标是找到一个策略,使得根据这个策略采取行动可以获得最大的累积奖励。PPO的主要思想是在更新策略时,尽量让新策略不要偏离旧策略太远。这是通过在目标函数中添加一个额外的项来实现的,这个额外的项 阅读全文
posted @ 2023-09-30 09:46 bonelee 阅读(4633) 评论(1) 推荐(0) 编辑
摘要: 针对夸夸闲聊数据集,利用UniLM模型进行模型训练及测试,更深入地了解预训练语言模型的使用方法,完成一个生成式闲聊机器人任务。 项目主要结构如下: data 存放数据的文件夹 dirty_word.txt 敏感词数据 douban_kuakua_qa.txt 原始语料 【数据量:大概20M的样子】= 阅读全文
posted @ 2023-09-27 11:32 bonelee 阅读(962) 评论(0) 推荐(0) 编辑
摘要: 注入类型 C++代码实现链接和检测思考 检测优先级 备注Portable Executable Injection - PE注入 https://www.cnblogs.com/bonelee/p/17719649.html 高 核心还是创建远程线程,不过有PE重定位表的修复Thread Execu 阅读全文
posted @ 2023-09-21 12:18 bonelee 阅读(414) 评论(0) 推荐(0) 编辑
摘要: 线程劫持:运行方法 C:\Users\l00379637\source\repos\thread_hijack\x64\Release\thread_hijack.exe 18132 C:\Users\l00379637\source\repos\injected_dll\x64\Release\i 阅读全文
posted @ 2023-09-19 12:11 bonelee 阅读(957) 评论(1) 推荐(0) 编辑
摘要: GPT大模型下,如何实现网络自主防御 本期解读专家 李智华 华为安全AI算法专家 近年来,随着GPT大模型的出现,安全领域的攻防对抗变得更加激烈。RSAC2023人工智能安全议题重点探讨了人工智能安全的最新发展,包括人工智能合成器安全、安全机器学习以及如何利用渗透测试和强化学习技术来确保人工智能模型 阅读全文
posted @ 2023-06-04 17:14 bonelee 阅读(846) 评论(0) 推荐(1) 编辑
摘要: 从攻击视角探讨ChatGPT对网络安全的影响 专家介绍:李智华,华为安全AI算法专家,中科院博士 ChatGPT是OpenAI 发布的基于人工智能的对话机器人,上线短短2个月活跃用户就突破了1亿,成为全球关注的焦点。ChatGPT可以自动化地处理对话,可以通过基于自然语言处理技术的模型、情景模型和语 阅读全文
posted @ 2023-02-25 09:25 bonelee 阅读(1150) 评论(2) 推荐(1) 编辑
摘要: 从防御视角探讨ChatGPT对网络安全的影响 专家介绍:李智华,华为安全AI算法专家,中科院博士 ChatGPT的核心优势是通过基于自然语言处理技术模型、情景模型和语言模型来自动生成文章和代码。在前面的文章中,我们从攻击视角探讨了ChatGPT对网络安全的影响, 本文将从防御视角来探讨ChatGPT 阅读全文
posted @ 2023-02-25 09:24 bonelee 阅读(653) 评论(0) 推荐(0) 编辑
摘要: RSA 2022人工智能安全洞察——在对抗中前进 李智华 中科院博士,华为安全AI算法专家 人工智能和机器学习在安全中的应用是一个屡见不鲜的话题,同样在2022 RSA大会中出现了围绕AI/ML为重点的焦点议题。此次会议中重点探讨了AI对抗和隐私合规问题,还有时下热门的零信任、API安全和威胁狩猎等 阅读全文
posted @ 2022-07-12 09:57 bonelee 阅读(443) 评论(7) 推荐(0) 编辑
摘要: 多元智能理论由心理学家霍华德·加德纳(Howard Gardner)提出,认为智能不仅仅是传统的语言和数学能力,而是由多种不同的能力组成。加德纳在1983年首次提出这一理论,最初识别了七种智能,后来又增加了几种。以下是多元智能的主要类型: 语言智能(Linguistic Intelligence): 阅读全文
posted @ 2024-12-16 10:29 bonelee 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 实施语义缓存以改进 RAG 系统 1.缓存介绍 在本笔记本中,我们将探索一个典型的 RAG 解决方案,其中我们将使用开源模型和向量数据库 Chroma DB。但是,我们将集成一个语义缓存系统,该系统将存储各种用户查询,并决定是否生成包含来自向量数据库或缓存的信息的提示。 语义缓存系统旨在识别相似或相 阅读全文
posted @ 2024-11-28 16:06 bonelee 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 比较 RAG 第 1 部分:块大小分割实验 我探索了 RAG 模型中的各种块大小,并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知,检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。 在这个实验中,我采用了BGE作为嵌入技术(它在 HuggingFace 的 阅读全文
posted @ 2024-11-28 14:37 bonelee 阅读(23) 评论(0) 推荐(0) 编辑
摘要: import bisect import logging from typing import Dict, List, Optional, Tuple, Union from llama_index.core.node_parser import SemanticSplitterNodeParser 阅读全文
posted @ 2024-11-19 10:58 bonelee 阅读(37) 评论(0) 推荐(0) 编辑
摘要: 李嘉誠 教五年內買車買房. 假設你的月收入只有2000元,你也可以過得很好。我幫你把錢分成五份。第一份600元,第二份400元,第三份300元,第四份200元,第五份500元。 第一份,用來做生活費。這麼少的生活費,每天只能夠分到十幾元。早餐一份煮米絲,一個雞蛋,一杯豆漿。中餐一份快餐,一個水果。晚 阅读全文
posted @ 2024-11-18 10:07 bonelee 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 其实刘丰老师专门讨论过一维到N维智慧,一维如同一条线,二维如画面,三维为立体,到了四维则超越了时间和空间的局限。每提升一个维度,感受到的美会提升无穷多倍。而N维智慧表示超越的可能,当N趋于无穷大时,表达人类达到无上智慧和圆满的境界。这种智慧强调对宇宙的无限圆满的理解,即宇宙本性是自足的,永恒的。低维 阅读全文
posted @ 2024-10-11 11:57 bonelee 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 单独的文字音频 + 背景音乐音频合成程序: from pydub import AudioSegment for_file = r"D:\个人\疗愈内在小孩.mp3" for_file = r"D:\个人\发大愿-for.mp3" for_file = r"D:\个人\拥抱内在回归真我.mp3" f 阅读全文
posted @ 2024-10-08 19:35 bonelee 阅读(20) 评论(0) 推荐(0) 编辑