rerank来提升RAG的准确度的策略

摘要: RAG(Retrieval-Augmented Generation)是一种结合检索和生成两种技术的模型,旨在通过检索大规模知识库来增强文本生成任务的准确性。 要通过reranking(重排序)来提升RAG的准确度,可以采取以下策略: 1. 使用更精细的评分函数 RAG通常会在检索阶段根据输入问题或 阅读全文
posted @ 2024-04-24 22:05 ercom 阅读(63) 评论(0) 推荐(0) 编辑

Ollama是什么,为什么这么好用

摘要: Ollama 是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 以下是其主要特点和功能概述: 1. 简化部署:Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程,使得非专业用户也能方便地管理和运行这些复杂的模型。 2. 轻量级与可扩展:作为轻量级框架 阅读全文
posted @ 2024-04-24 22:00 ercom 阅读(115) 评论(0) 推荐(0) 编辑

LlamaIndex 常见问题解答(FAQ)

摘要: 提示:如果您尚未完成,请安装 LlamaIndex 并完成起步教程。遇到不熟悉的术语时,请参考高层次概念部分。 在这个章节中,我们将从您为起步示例编写的代码开始,展示您可能希望针对不同应用场景对其进行的常见定制方法: python from llama_index.core import Vecto 阅读全文
posted @ 2024-04-14 23:04 ercom 阅读(28) 评论(0) 推荐(0) 编辑

LlamaIndex 起步教程(本地模型)

摘要: 提示:确保您已先按照自定义安装步骤操作。 这是一个著名的“五行代码”起步示例,使用本地 LLM(大语言模型)和嵌入模型。我们将使用 BAAI/bge-small-en-v1.5 作为嵌入模型,通过 Ollama 服务的 Mistral-7B 作为 LLM。 下载数据 本示例使用 Paul Graha 阅读全文
posted @ 2024-04-14 23:03 ercom 阅读(97) 评论(0) 推荐(0) 编辑

LlamaIndex 探索视频系列

摘要: 如果您喜欢通过视频学习,现在正是查看我们的“探索 LlamaIndex”系列的好时机。否则,我们建议您继续阅读“理解 LlamaIndex”教程。 自下而上开发(Llama Docs Bot) 这是“探索 LlamaIndex”系列中的一个子系列,向您展示如何从零开始构建文档聊天机器人。 我们将以“ 阅读全文
posted @ 2024-04-14 23:03 ercom 阅读(1) 评论(0) 推荐(0) 编辑

LlamaIndex 安装与配置(不含OpenAI)

摘要: pip install llama-index 这是一个包含以下组件的启动包: llama-index-core llama-index-legacy (暂时包含) llama-index-llms-openai llama-index-embeddings-openai llama-index-p 阅读全文
posted @ 2024-04-14 23:02 ercom 阅读(36) 评论(0) 推荐(0) 编辑

LlamaIndex 高层次概念

摘要: 本篇内容为您快速介绍在构建基于大型语言模型(LLM)的应用程序时会频繁遇到的一些核心概念。 增强检索生成(RAG) LLM 是基于海量数据训练而成,但并未涵盖您的具体数据。增强检索生成(Retrieval-Augmented Generation, RAG)通过将您的数据添加至 LLM 已有的数据集 阅读全文
posted @ 2024-04-14 23:01 ercom 阅读(11) 评论(0) 推荐(0) 编辑

LlamaIndex 是什么

摘要: LlamaIndex 是一个基于 LLM(大语言模型)的应用程序数据框架,适用于受益于上下文增强的场景。 这类 LLM 系统被称为 RAG(检索增强生成)系统。 LlamaIndex 提供了必要的抽象层,以便更容易地摄取、结构化和访问私有或特定领域的数据,从而安全可靠地将这些数据注入 LLM 中,以 阅读全文
posted @ 2024-04-14 23:01 ercom 阅读(34) 评论(0) 推荐(0) 编辑

RAG 工具和框架介绍: Haystack、 LangChain 和 LlamaIndex

摘要: Haystack、 LangChain 和 LlamaIndex,以及这些工具是如何让我们轻松地构建 RAG 应用程序的? 我们将重点关注以下内容: Haystack LangChain LlamaIndex 增强LLM 那么,为什么会有这些工具存在呢?如你所知,ChatGPT和其他LLM是在某个时 阅读全文
posted @ 2024-04-14 22:53 ercom 阅读(52) 评论(0) 推荐(0) 编辑

Docker Desktop v20.10.8 和 WSL2 迁移镜像存储目录

摘要: 只迁移存储镜像和挂载文件目录:https://www.cnblogs.com/lemonK/p/17781775.html 同时迁移docker程序目录:https://www.cnblogs.com/kkbk/p/17702465.html OnlineTool Link:https://www. 阅读全文
posted @ 2024-04-11 12:31 ercom 阅读(2) 评论(0) 推荐(0) 编辑

embedding models 是什么

摘要: embedding models 是一类机器学习模型,它们的核心功能是将高维、离散的输入数据(如词汇、类别标签、节点或实体)映射到低维、连续的向量空间中。 这些向量(即 embeddings)通常具有丰富的语义信息,并能够捕捉原始数据之间的潜在关系和相似度。以下是对 embedding models 阅读全文
posted @ 2024-04-10 19:19 ercom 阅读(73) 评论(0) 推荐(0) 编辑

大模型 RAG 是什么

摘要: 大模型 RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)与生成(Generation)能力的先进人工智能技术,主要用于增强大型语言模型(LLMs,Large Language Models)在特定任务中的表现,特别是那些需要访问外部知识库或 阅读全文
posted @ 2024-04-10 19:17 ercom 阅读(124) 评论(0) 推荐(0) 编辑

通用的 AI prompt 实操技巧

摘要: 1. 提供清晰、具体的目标在 Prompt 中明确指出你希望 AI 辅助完成的具体任务,包括要实现的功能、遵循的标准、适用的技术栈等。 2. 提供足够的上下文提供与任务相关的背景信息、现有代码片段、接口文档、数据结构等,帮助 AI 更好地理解你的意图。 3. **使用结构化和层次化的提示**将复杂的 阅读全文
posted @ 2024-04-10 19:16 ercom 阅读(13) 评论(0) 推荐(0) 编辑

油猴脚本的用处

摘要: 油猴脚本(通常指使用用户脚本管理器如 Tampermonkey 运行的 JavaScript 脚本)具有多种用途,主要用于增强或定制网页浏览体验,实现自动化操作,以及解决特定网站的功能缺失或不便之处。 以下列举了一些油猴脚本的主要用处: 1.个性化网页布局与样式: 修改网页主题色、字体、间距等,实现 阅读全文
posted @ 2024-04-10 19:14 ercom 阅读(53) 评论(0) 推荐(0) 编辑

[GPT] golang代码组织的核心思想

摘要: 1/golang代码组织的核心思想 Go语言(Golang)在代码组织上的核心思想是模块化和封装,主要体现在以下几个方面: 1、包(Packages): Go语言通过包(Packages)来组织代码,每个包包含一组相关联的.go源文件。包提供了一种天然的代码边界,允许开发者将相关功能逻辑组合在一起, 阅读全文
posted @ 2024-03-29 18:32 ercom 阅读(4) 评论(0) 推荐(0) 编辑

[GPT] swoole的协程和golang的协程有什么区别,哪个更好

摘要: Swoole 的协程和 Golang(Go 语言)的协程(Goroutine)在概念上都是为了实现轻量级的并发编程,但它们在具体实现、使用方式和性能特点上有所不同: 实现原理: Golang 协程(Goroutine):Go 语言从语言层面内置了对协程的支持。Goroutine 是由 Go 运行时系 阅读全文
posted @ 2024-03-21 20:33 ercom 阅读(8) 评论(0) 推荐(0) 编辑

[GPT] nodejs 什么情况下可以使用 import 来引入 export 的模块

摘要: 在 Node.js 中,原生并不支持 ES6 的 import 语句来引入模块。 不过从 Node.js v12 开始,通过实验性功能(--experimental-modules)可以使用 .mjs 扩展名的文件来启用对 ES6 模块的支持,并使用 import 语句。 新版本 Nodejs 已移 阅读全文
posted @ 2024-03-13 22:24 ercom 阅读(18) 评论(0) 推荐(0) 编辑

[GPT] export, export default, import, module.exports, require

摘要: ES6 规范:export 和 import 配对 import 的 {} 大括号里面指定要从其他模块导入的变量名, 如果 export 命令没有写 default,那么 import {} 大括号里面的变量名,必须与 export 导出的名称相同。 export default 为模块指定默认输出 阅读全文
posted @ 2024-03-13 22:22 ercom 阅读(1) 评论(0) 推荐(0) 编辑

[GPT] export default {} 和 export {} 的区别

摘要: 在JavaScript ES6模块系统中,export default {} 和 export {} 有明显的区别: 1. export default {}: 这个语法用于导出一个默认的模块成员,它可以是一个对象、函数、类等。当导入时,可以使用任何名称来引用这个默认导出的成员,或者不指定名称直接导 阅读全文
posted @ 2024-03-13 22:21 ercom 阅读(1) 评论(0) 推荐(0) 编辑

[GPT] quasar 在 setup() 周期阶段想设置meta信息,如何获取当前的 route 参数动态设置

摘要: 在Vue 3 的Composition API(组合式API)中,特别是在 setup() 钩子函数阶段, 由于没有访问到常规的 Vue 实例(this上下文),所以不能直接使用 this.$route 来获取路由信息。 但是,你可以通过 useRoute() 函数来访问当前活跃的路由对象: imp 阅读全文
posted @ 2024-03-07 23:41 ercom 阅读(12) 评论(0) 推荐(0) 编辑

[GPT] golang 有那么多系统包 该如何了解和学习

摘要: 在学习和了解Golang(Go语言)的系统包时,可以遵循以下步骤来逐步熟悉并掌握它们: 1. 官方文档阅读: 首先从官方文档入手,Go的标准库文档非常详尽且易于理解。你可以访问 Go标准库 来查看各个包的详细说明、API使用方法以及示例代码。这将帮助你快速掌握每个包的核心功能和用法。 2. 分类学习 阅读全文
posted @ 2024-03-07 01:18 ercom 阅读(2) 评论(0) 推荐(0) 编辑

运行模型对比 gemma:7b, llama2, mistral, qwen:7b

摘要: 【gemma:2b】 total duration: 1m5.2381509sload duration: 530.9µsprompt eval duration: 110.304msprompt eval rate: 0.00 tokens/seval count: 604 token(s)eva 阅读全文
posted @ 2024-03-04 21:15 ercom 阅读(165) 评论(0) 推荐(0) 编辑

Docker Volume 的经常用法区别

摘要: 对于使用 NFS 的 Docker 数据卷,配置示例应当类似于这样: version: '3' services: my_service: image: your_image volumes: # 挂载命名的数据卷到容器内的路径(详细模式) - type: volume source: my_nfs 阅读全文
posted @ 2024-01-30 18:02 ercom 阅读(22) 评论(0) 推荐(0) 编辑

[FAQ] Docker查询出所有的停止容器并移除

摘要: $ docker rm `docker container ls -a --filter "status=exited" | awk '{print $1}' | sed '1,1d' | xargs` Ref:phvia/dkc Ref:[Shell] 字符截取命令:cut, printf, aw 阅读全文
posted @ 2024-01-16 11:33 ercom 阅读(9) 评论(0) 推荐(0) 编辑

[FAQ] puppeteer 清空输入框的值 并 重新输入

摘要: 一种方式是,清空输入框可以通过如下注入代码实现,但是可能存在 和页面本身的操作 存在优先级问题。 await page.evaluate( () => document.getElementById("inputID").value = "") 推荐另一种方式,用 puppeteer 对页面元素执行 阅读全文
posted @ 2024-01-09 18:56 ercom 阅读(59) 评论(0) 推荐(0) 编辑

Puppeteer 入门与进阶: 快速上手

摘要: Puppeteer API: https://puppeteer.bootcss.com/api 1. 安装: $ yarn add puppeterr 2. 网页截图实例: // main.jsconst puppeteer = require('puppeteer'); (async () => 阅读全文
posted @ 2024-01-07 20:49 ercom 阅读(6) 评论(0) 推荐(0) 编辑

[GPT] 同为 nodejs 库的 Puppeteer 和 cheerio 的区别是什么

摘要: Puppeteer 和 cheerio 是两个完全不同的库,用途和功能也截然不同。 Puppeteer 是一个 Node.js 库,它使用 Chrome 或 Chromium 浏览器作为渲染引擎,通过使用 Chrome 的 Headless 模式进行网页的解析和操作。 它提供了一组 API,可以让用 阅读全文
posted @ 2024-01-07 19:56 ercom 阅读(54) 评论(0) 推荐(0) 编辑

[FAQ] CodeLlama GGUF 文件下载

摘要: hf-mirror: https://hf-mirror.com/TheBloke/CodeLlama-7B-GGUFmodelscope: https://modelscope.cn/models/Xorbits/CodeLlama-7B-GGUF/ 进入主页后,可以看到推荐的模型是 codell 阅读全文
posted @ 2024-01-07 19:54 ercom 阅读(157) 评论(0) 推荐(0) 编辑

[FAQ] Mac Mini 怎么让主机不休眠

摘要: Mac Mini 的防止休眠设置,在首选项,显示器里。 显示器里找到高级按钮。 然后有个开关是:显示器关闭时,防止自动进入睡眠。打开这个开关即可防止自动睡眠。 Link:https://www.cnblogs.com/farwish/p/17925184.html 阅读全文
posted @ 2024-01-07 19:52 ercom 阅读(267) 评论(0) 推荐(0) 编辑

在线运行代码的 PHP 沙盒环境实现

摘要: 演示: 多版本PHP运行代码 作用: 方便作为独立的调试环境运行 一些 临时逻辑,查看执行结果。 方便比较不同版本的 PHP 执行差异,进行一般的兼容性测试。 思路: Docker镜像构建多个PHP运行端口,使用 php 命令行来运行 PHP 脚本,借助 PHP 接口执行输入。 操作: 1. 编写 阅读全文
posted @ 2023-11-02 14:05 ercom 阅读(187) 评论(0) 推荐(0) 编辑

[FAQ] html 的 select 标签 option 获取选中值的两种方式及区别

摘要: Q: 对于一个 html 的 select 标签节点 class是module_select,获取选中值使用 $('.module_select').find('option:selected').val() 和 $('.module_select').val() 有什么区别 A: $('.modu 阅读全文
posted @ 2023-10-31 00:45 ercom 阅读(443) 评论(0) 推荐(0) 编辑

[FAQ] 修改了Dockerfile 之后,运行 docker-compose up --force-recreate 时还是报之前构建时的错误?

摘要: 因为 Docker Compose 的 --force-recreate 选项只会强制重新创建容器,而不会重新构建镜像。 因此,如果你修改了Dockerfile,需要确保重新构建新的镜像。 你可以尝试以下步骤来解决这个问题: 1. 使用 docker-compose down 命令停止并移除之前的容 阅读全文
posted @ 2023-10-17 22:59 ercom 阅读(315) 评论(0) 推荐(0) 编辑

[FAQ] Python的虚拟环境和包管理

摘要: 1. 创建虚拟环境 $ python -m venv test-env 2. 激活虚拟环境 windows:tutorial-env\Scripts\activate (powershell: .\test-env\Scripts\Activate.ps1) linux:source tutoria 阅读全文
posted @ 2023-10-17 22:59 ercom 阅读(13) 评论(0) 推荐(0) 编辑

[FAQ] 快速准备 windows 的 nodejs 开发环境

摘要: 下载 git 版本控制系统:https://pc.qq.com/search.html#!keyword=git 下载 TortoiseGit 客户端:https://pc.qq.com/search.html#!keyword=git 下载 vscode 编辑器:https://pc.qq.com 阅读全文
posted @ 2023-10-05 19:46 ercom 阅读(2) 评论(0) 推荐(0) 编辑

[FAQ] eggjs/egg 自定义 favicon.ico

摘要: 从 egg 项目配置里找到这一段代码: https://github.com/eggjs/egg/blob/master/config/config.default.js#L205C21-L205C74 /** * The option of `siteFile` middleware * * Yo 阅读全文
posted @ 2023-09-24 17:17 ercom 阅读(25) 评论(0) 推荐(0) 编辑

[FAQ] Sortable 拖拽组件, 火狐浏览器中打开新窗口问题

摘要: Q:用了 sortable 组件,在火狐浏览器中进行拖拽时,会打开新窗口 ? Sortable组件地址,https://github.com/SortableJS/Sortable 当前处理方式 阻止火狐浏览器中打开新窗口。 产生原因 Chatgpt : Other:HtmlCheck Link:h 阅读全文
posted @ 2023-09-20 13:44 ercom 阅读(125) 评论(0) 推荐(0) 编辑

[FAQ] Git远程仓库想把目录大写改为小写,windows本地不识别的的处理

摘要: 通过四步操作: 1. 先把忽略大小写设为false,即区分大小写git config core.ignorecase false 2. 拷贝出来备份那几个大写的目录,随后分支上操作删除,提交到远程。 3. 备份出来的目录改为小写,拷贝到代码分支的目录里,提交到远程。 4.恢复成原来的设置 git c 阅读全文
posted @ 2023-09-19 09:29 ercom 阅读(59) 评论(0) 推荐(0) 编辑

[FAQ] 适用于 macOS / Arm64 (M1/M2) 的 VisualBox

摘要: 使用与 Windows、Linux、macOS 的x86架构的一般在下面地址中下载: Download VisualBox:https://www.virtualbox.org/wiki/Downloads 针对于 macOS M架构的安装包,不一定会有具体某个版本的。 “ 在 7.0 支上不会有更 阅读全文
posted @ 2023-09-16 15:53 ercom 阅读(496) 评论(0) 推荐(0) 编辑

[FAQ] VsCode 同时多行编辑

摘要: 【多光标自定义编辑】 按住 alt 键,鼠标左键点击,出现多个光标。 【批量选中匹配编辑】 鼠标选中字符,按快捷键 ctrl + shift + L,字符的右侧都出现光标,可同时编辑。 Tool:在线编辑器集合 Ref:https://zhuanlan.zhihu.com/p/369369584 L 阅读全文
posted @ 2023-09-08 20:09 ercom 阅读(88) 评论(0) 推荐(0) 编辑

[FAQ] edge debug栏的网络里 没有见到 All Fetch/XHR JS CSS 这些东西

摘要: 一种方式是 打开调试器的设置,重置默认并刷新即可。 另一种方式是把这个 “筛选” 点掉。 Tool:揭开网站所用的技术 Link:https://www.cnblogs.com/farwish/p/17687523.html 阅读全文
posted @ 2023-09-08 20:06 ercom 阅读(753) 评论(0) 推荐(0) 编辑