老牛啊 - 博客园

2024年9月7日

Agent(智能体)和 MetaGPT，一句话实现整个需求应用代码

摘要：

本文介绍了大模型 Agent 定义、组成部分，并以 MetaGPT 多智能体为例，一句话完成贪吃蛇小游戏需求，以介绍整个智能体的工作流程…… 阅读全文

posted @ 2024-09-07 20:14 老牛啊阅读(262) 评论(0) 推荐(0) 编辑

2024年8月31日

ChatTTS 长音频合成和本地部署2种方式，让你的“儿童绘本”发声的实战教程（文末有福利）

摘要：

本文介绍 ChatTTS 最新版本的 2 种本地部署方式，并通过短音频合成长音频的技术手段，解决 ChatTTS 合成音频最长 30 秒时长的限制，同时，我们让绘本故事文本转长音频…… 阅读全文

posted @ 2024-08-31 20:09 老牛啊阅读(666) 评论(0) 推荐(0) 编辑

2024年8月27日

GLM-4-Flash 大模型API免费了，手把手构建“儿童绘本”应用实战（附源码）

摘要：

GLM-4-Flash 大模型API免费了，我们本文基于免费API构建一个“儿童绘本”应用，包括使用文生图产出绘本故事插图…… 阅读全文

posted @ 2024-08-27 21:30 老牛啊阅读(837) 评论(0) 推荐(0) 编辑

2024年8月24日

InternLM 2.5 书生·浦语开源大模型本地部署体验

摘要：

上海人工智能实验室发布了书生·浦语（InternLM）新开源版本，增强了在复杂场景下的推理能力，本文介绍在本地进行部署和推理…… 阅读全文

posted @ 2024-08-24 00:43 老牛啊阅读(339) 评论(0) 推荐(0) 编辑

2024年8月14日

MiniCPM-V 2.6 面壁“小钢炮”，多图、视频理解多模态模型，部署和推理实战教程

摘要：

MiniCPM-V 最新发布了 2.6 版本，仅 8B 的参数量，但在图片、视频方面理解能力表现卓越，本教程在本地进行部署和推理实战…… 阅读全文

posted @ 2024-08-14 23:32 老牛啊阅读(1962) 评论(0) 推荐(0) 编辑

2024年8月11日

vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程

摘要：

vLLM默认并不支持纯CPU模式部署和推理模式，老牛同学应网友要求，根据vLLM官网整理vLLM在CPU模式下如何部署和推理大语音模型，并以Qwen2为了进行验证和演示…… 阅读全文

posted @ 2024-08-11 14:58 老牛啊阅读(7274) 评论(0) 推荐(2) 编辑

2024年8月2日

PyTorch 训练自定义功能齐全的神经网络模型的详细教程

摘要：

PyTorch 是一个开源的机器学习框架，可以方便地进行神经网络模型训练和推理。本文基于 PyTorch 演示了一个非常简单但是功能齐全的神经网络训练过程，无论模型权重有多大，使用 TyTorch 训练的过程是类似的，期望本文能启到抛砖引玉的作用…… 阅读全文

posted @ 2024-08-02 23:50 老牛啊阅读(321) 评论(0) 推荐(0) 编辑

2024年7月27日

太卷了，阿里云免费1个月大模型算力额度，玩转Llama3.1/Qwen2等训练推理

摘要：

阿里云百炼平台发布推文，提供30天免费算力额度，助力玩转 Llama3.1 训练推理。老牛同学首当其冲，去体验一把，本文详细记录了整个过程，同时给出了老牛同学的一些想法，欢迎交流学习…… 阅读全文

posted @ 2024-07-27 01:35 老牛啊阅读(370) 评论(0) 推荐(0) 编辑

2024年7月20日

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

摘要：

本教程详细介绍了 LoRA 参数高效微调技术，包括数据集准备和处理、模型加载、参数设置等，然后以 Qwen2-0.5B 预训练模型实践，进行了文本分类能力微调，微调过程通过 SwanLab 可视化界面查看，最终微调模型进行测试数据评估…… 阅读全文

posted @ 2024-07-20 00:29 老牛啊阅读(9008) 评论(5) 推荐(4) 编辑

2024年7月14日

LivePortrait 数字人：开源的图生视频模型，本地部署和专业视频制作详细教程

摘要：

数字人最近比较火，LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型，比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程，详细介绍如何在本地部署和生成专业视频…… 阅读全文

posted @ 2024-07-14 13:52 老牛啊阅读(1922) 评论(0) 推荐(0) 编辑

2024年7月10日

Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用

摘要：

Ollama可以非常方便的管理和部署我们本地大语言模型，老牛同学希望通过本文对Ollama进行一次详细介绍，包括本地大模型管理和使用、WebUI对话界面部署、通过Python和Java使用Ollama的API接口等…… 阅读全文

posted @ 2024-07-10 23:25 老牛啊阅读(102769) 评论(2) 推荐(15) 编辑

2024年7月6日

基于Qwen2/Lllama3等大模型，部署团队私有化RAG知识库系统的详细教程（Docker+AnythingLLM）

摘要：

大语言模型在垂直细分领域存在知识局限、幻觉、数据安全等一些问题，可通过RAG（检索增强生成）方案来解决。本文基于AnythingLLM框架，搭建团队私有知识库系统，并进行使用和验证，RAG系统在保留输出的有效性同时，还保留了创造性…… 阅读全文

posted @ 2024-07-06 15:51 老牛啊阅读(5911) 评论(0) 推荐(0) 编辑

2024年7月4日

阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？

摘要：

阿里Qwen2-72B大模型已是开源榜的王者，为什么还要推出其他参数模型，被其他模型打榜？阅读全文

posted @ 2024-07-04 23:09 老牛啊阅读(640) 评论(0) 推荐(0) 编辑

2024年7月2日

Google 发布了最新的开源大模型 Gemma 2，本地快速部署和体验

摘要：

Google 重磅发布了最新版大语言模型Gemma 2，其中 90亿参数版本适合我们个人在笔记本本地部署，老牛同学通过本文和大家一起，通过2种方式快速部署和体验，当然这2种快速部署模型的方式，也同样适用于其他大模型…… 阅读全文

posted @ 2024-07-02 23:12 老牛啊阅读(1955) 评论(0) 推荐(0) 编辑

2024年6月30日

使用Llama3/Qwen2等开源大模型，部署团队私有化Code Copilot和使用教程

摘要：

代码辅助工具（Code Copilot）可以提高团队代码研发效率，能有效帮助产品快速上市抢占先发优势，但同时又需要保证代码和信息隐私，私有化Code Copilot是保护隐私的重要手段。老牛通过本文，详细介绍通过开源大模型，部署私有化Code Copilot和使用教程…… 阅读全文

posted @ 2024-06-30 01:06 老牛啊阅读(1818) 评论(0) 推荐(0) 编辑

奔跑的蜗牛·老牛同学

奔跑的蜗牛，记录的点滴：https://ntopic.cn

公告

常用链接

我的标签

合集 (6)

随笔分类 (137)

博客空间

阅读排行榜

推荐排行榜