摘要: Agent(智能体)和 MetaGPT,一句话实现整个需求应用代码 本文介绍了大模型 Agent 定义、组成部分,并以 MetaGPT 多智能体为例,一句话完成贪吃蛇小游戏需求,以介绍整个智能体的工作流程…… 阅读全文
posted @ 2024-09-07 20:14 老牛啊 阅读(262) 评论(0) 推荐(0) 编辑
摘要: ChatTTS 长音频合成和本地部署2种方式,让你的“儿童绘本”发声的实战教程(文末有福利) 本文介绍 ChatTTS 最新版本的 2 种本地部署方式,并通过短音频合成长音频的技术手段,解决 ChatTTS 合成音频最长 30 秒时长的限制,同时,我们让绘本故事文本转长音频…… 阅读全文
posted @ 2024-08-31 20:09 老牛啊 阅读(666) 评论(0) 推荐(0) 编辑
摘要: GLM-4-Flash 大模型API免费了,手把手构建“儿童绘本”应用实战(附源码) GLM-4-Flash 大模型API免费了,我们本文基于免费API构建一个“儿童绘本”应用,包括使用文生图产出绘本故事插图…… 阅读全文
posted @ 2024-08-27 21:30 老牛啊 阅读(837) 评论(0) 推荐(0) 编辑
摘要: InternLM 2.5 书生·浦语 开源大模型本地部署体验 上海人工智能实验室发布了书生·浦语(InternLM)新开源版本,增强了在复杂场景下的推理能力,本文介绍在本地进行部署和推理…… 阅读全文
posted @ 2024-08-24 00:43 老牛啊 阅读(339) 评论(0) 推荐(0) 编辑
摘要: MiniCPM-V 2.6 面壁“小钢炮”,多图、视频理解多模态模型,部署和推理实战教程 MiniCPM-V 最新发布了 2.6 版本,仅 8B 的参数量,但在图片、视频方面理解能力表现卓越,本教程在本地进行部署和推理实战…… 阅读全文
posted @ 2024-08-14 23:32 老牛啊 阅读(1962) 评论(0) 推荐(0) 编辑
摘要: vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程 vLLM默认并不支持纯CPU模式部署和推理模式,老牛同学应网友要求,根据vLLM官网整理vLLM在CPU模式下如何部署和推理大语音模型,并以Qwen2为了进行验证和演示…… 阅读全文
posted @ 2024-08-11 14:58 老牛啊 阅读(7274) 评论(0) 推荐(2) 编辑
摘要: PyTorch 训练自定义功能齐全的神经网络模型的详细教程 PyTorch 是一个开源的机器学习框架,可以方便地进行神经网络模型训练和推理。本文基于 PyTorch 演示了一个非常简单但是功能齐全的神经网络训练过程,无论模型权重有多大,使用 TyTorch 训练的过程是类似的,期望本文能启到抛砖引玉的作用…… 阅读全文
posted @ 2024-08-02 23:50 老牛啊 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 太卷了,阿里云免费1个月大模型算力额度,玩转Llama3.1/Qwen2等训练推理 阿里云百炼平台发布推文,提供30天免费算力额度,助力玩转 Llama3.1 训练推理。老牛同学首当其冲,去体验一把,本文详细记录了整个过程,同时给出了老牛同学的一些想法,欢迎交流学习…… 阅读全文
posted @ 2024-07-27 01:35 老牛啊 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 基于 Qwen2 大模型微调技术详细教程(LoRA 参数高效微调和 SwanLab 可视化监控) 本教程详细介绍了 LoRA 参数高效微调技术,包括数据集准备和处理、模型加载、参数设置等,然后以 Qwen2-0.5B 预训练模型实践,进行了文本分类能力微调,微调过程通过 SwanLab 可视化界面查看,最终微调模型进行测试数据评估…… 阅读全文
posted @ 2024-07-20 00:29 老牛啊 阅读(9008) 评论(5) 推荐(4) 编辑
摘要: LivePortrait 数字人:开源的图生视频模型,本地部署和专业视频制作详细教程 数字人最近比较火,LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型,比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程,详细介绍如何在本地部署和生成专业视频…… 阅读全文
posted @ 2024-07-14 13:52 老牛啊 阅读(1922) 评论(0) 推荐(0) 编辑
摘要: Ollama完整教程:本地LLM管理、WebUI对话、Python/Java客户端API应用 Ollama可以非常方便的管理和部署我们本地大语言模型,老牛同学希望通过本文对Ollama进行一次详细介绍,包括本地大模型管理和使用、WebUI对话界面部署、通过Python和Java使用Ollama的API接口等…… 阅读全文
posted @ 2024-07-10 23:25 老牛啊 阅读(102769) 评论(2) 推荐(15) 编辑
摘要: 基于Qwen2/Lllama3等大模型,部署团队私有化RAG知识库系统的详细教程(Docker+AnythingLLM) 大语言模型在垂直细分领域存在知识局限、幻觉、数据安全等一些问题,可通过RAG(检索增强生成)方案来解决。本文基于AnythingLLM框架,搭建团队私有知识库系统,并进行使用和验证,RAG系统在保留输出的有效性同时,还保留了创造性…… 阅读全文
posted @ 2024-07-06 15:51 老牛啊 阅读(5911) 评论(0) 推荐(0) 编辑
摘要: 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阅读全文
posted @ 2024-07-04 23:09 老牛啊 阅读(640) 评论(0) 推荐(0) 编辑
摘要: Google 发布了最新的开源大模型 Gemma 2,本地快速部署和体验 Google 重磅发布了最新版大语言模型Gemma 2,其中 90亿 参数版本适合我们个人在笔记本本地部署,老牛同学通过本文和大家一起,通过2种方式快速部署和体验,当然这2种快速部署模型的方式,也同样适用于其他大模型…… 阅读全文
posted @ 2024-07-02 23:12 老牛啊 阅读(1955) 评论(0) 推荐(0) 编辑
摘要: 使用Llama3/Qwen2等开源大模型,部署团队私有化Code Copilot和使用教程 代码辅助工具(Code Copilot)可以提高团队代码研发效率,能有效帮助产品快速上市抢占先发优势,但同时又需要保证代码和信息隐私,私有化Code Copilot是保护隐私的重要手段。老牛通过本文,详细介绍通过开源大模型,部署私有化Code Copilot和使用教程…… 阅读全文
posted @ 2024-06-30 01:06 老牛啊 阅读(1818) 评论(0) 推荐(0) 编辑

奔跑的蜗牛 博客:https://ntopic.cn

点击右上角即可分享
微信分享提示