随笔分类 - LLM

大语言模型相关

摘要：简介本文介绍（经过多次踩坑摸索出来的）在 Windows 系统、AMD Radeon 680M 核显上运行 llama.cpp 的方法。 Radeon 680M 是 AMD Ryzen 6000 系列移动处理中的中高端型号（7、9）搭载的核显： Ryzen 7 6800U: 2200 MHz Ry 阅读全文

posted @ 2025-02-09 22:00 Eslzzyl 阅读(406) 评论(0) 推荐(0) 编辑

Continue+LLM打造本地运行的Copilot服务

摘要：简介 GitHub Copilot 已经出来很长时间了。该服务收费且在国内连接不够稳定，延迟也比较高。目前大语言模型生态蓬勃发展，已经诞生了一批专精于代码生成的大模型，例如： https://huggingface.co/mistralai/Codestral-22B-v0.1 https://hu 阅读全文

posted @ 2024-09-07 16:16 Eslzzyl 阅读(2545) 评论(0) 推荐(0) 编辑

Qwen2-72B的vLLM部署

摘要：今天尝试本地部署了 Qwen2-72B-Instruct-GPTQ-Int4 模型，这里记录一下操作的过程。参考： https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html https://docs.vllm.ai/en/stabl 阅读全文

posted @ 2024-08-24 20:46 Eslzzyl 阅读(7482) 评论(2) 推荐(0) 编辑

Linux 环境下部署 SakuraLLM

摘要：SakuraLLM 是一款适配轻小说和 GalGame 的日中翻译大语言模型。该项目的使用文档主要面向 Windows 用户，然而，大多数 GPU 服务器都运行 Linux 系统。本文将简单介绍在 Unbutu 系统中运行 SakuraLLM 的过程。本文使用的软硬件环境如下：系统：Ubunt 阅读全文

posted @ 2024-07-25 14:33 Eslzzyl 阅读(388) 评论(0) 推荐(0) 编辑

基于大语言模型的 Zotero 论文翻译方案

摘要：前言今年不少国产大模型在打价格战，有些小模型甚至免费提供 API 使用。gpt-4o-mini 的推出更是击穿了大模型 API 的底价。未来预计会出现更强大、更便宜的模型。笔者使用 Zotero 的论文翻译插件 zotero-pdf-translate 也有一段时间了，但长期以来一直使用 Goo 阅读全文

posted @ 2024-07-21 18:33 Eslzzyl 阅读(2327) 评论(0) 推荐(1) 编辑

2025年3月

日

一

二

三

四

五

六

Eslzzyl

随笔分类 - LLM

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论