摘要: vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程 vLLM默认并不支持纯CPU模式部署和推理模式,老牛同学应网友要求,根据vLLM官网整理vLLM在CPU模式下如何部署和推理大语音模型,并以Qwen2为了进行验证和演示…… 阅读全文
posted @ 2024-08-11 14:58 老牛啊 阅读(3434) 评论(0) 推荐(0) 编辑
摘要: PyTorch 训练自定义功能齐全的神经网络模型的详细教程 PyTorch 是一个开源的机器学习框架,可以方便地进行神经网络模型训练和推理。本文基于 PyTorch 演示了一个非常简单但是功能齐全的神经网络训练过程,无论模型权重有多大,使用 TyTorch 训练的过程是类似的,期望本文能启到抛砖引玉的作用…… 阅读全文
posted @ 2024-08-02 23:50 老牛啊 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 太卷了,阿里云免费1个月大模型算力额度,玩转Llama3.1/Qwen2等训练推理 阿里云百炼平台发布推文,提供30天免费算力额度,助力玩转 Llama3.1 训练推理。老牛同学首当其冲,去体验一把,本文详细记录了整个过程,同时给出了老牛同学的一些想法,欢迎交流学习…… 阅读全文
posted @ 2024-07-27 01:35 老牛啊 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 基于 Qwen2 大模型微调技术详细教程(LoRA 参数高效微调和 SwanLab 可视化监控) 本教程详细介绍了 LoRA 参数高效微调技术,包括数据集准备和处理、模型加载、参数设置等,然后以 Qwen2-0.5B 预训练模型实践,进行了文本分类能力微调,微调过程通过 SwanLab 可视化界面查看,最终微调模型进行测试数据评估…… 阅读全文
posted @ 2024-07-20 00:29 老牛啊 阅读(5820) 评论(5) 推荐(4) 编辑
摘要: LivePortrait 数字人:开源的图生视频模型,本地部署和专业视频制作详细教程 数字人最近比较火,LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型,比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程,详细介绍如何在本地部署和生成专业视频…… 阅读全文
posted @ 2024-07-14 13:52 老牛啊 阅读(1464) 评论(0) 推荐(0) 编辑
摘要: Ollama完整教程:本地LLM管理、WebUI对话、Python/Java客户端API应用 Ollama可以非常方便的管理和部署我们本地大语言模型,老牛同学希望通过本文对Ollama进行一次详细介绍,包括本地大模型管理和使用、WebUI对话界面部署、通过Python和Java使用Ollama的API接口等…… 阅读全文
posted @ 2024-07-10 23:25 老牛啊 阅读(40087) 评论(1) 推荐(9) 编辑
摘要: 基于Qwen2/Lllama3等大模型,部署团队私有化RAG知识库系统的详细教程(Docker+AnythingLLM) 大语言模型在垂直细分领域存在知识局限、幻觉、数据安全等一些问题,可通过RAG(检索增强生成)方案来解决。本文基于AnythingLLM框架,搭建团队私有知识库系统,并进行使用和验证,RAG系统在保留输出的有效性同时,还保留了创造性…… 阅读全文
posted @ 2024-07-06 15:51 老牛啊 阅读(3125) 评论(0) 推荐(0) 编辑
摘要: 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阅读全文
posted @ 2024-07-04 23:09 老牛啊 阅读(454) 评论(0) 推荐(0) 编辑
摘要: Google 发布了最新的开源大模型 Gemma 2,本地快速部署和体验 Google 重磅发布了最新版大语言模型Gemma 2,其中 90亿 参数版本适合我们个人在笔记本本地部署,老牛同学通过本文和大家一起,通过2种方式快速部署和体验,当然这2种快速部署模型的方式,也同样适用于其他大模型…… 阅读全文
posted @ 2024-07-02 23:12 老牛啊 阅读(1482) 评论(0) 推荐(0) 编辑
摘要: 使用Llama3/Qwen2等开源大模型,部署团队私有化Code Copilot和使用教程 代码辅助工具(Code Copilot)可以提高团队代码研发效率,能有效帮助产品快速上市抢占先发优势,但同时又需要保证代码和信息隐私,私有化Code Copilot是保护隐私的重要手段。老牛通过本文,详细介绍通过开源大模型,部署私有化Code Copilot和使用教程…… 阅读全文
posted @ 2024-06-30 01:06 老牛啊 阅读(1233) 评论(0) 推荐(0) 编辑
摘要: 大模型应用研发基础环境配置(Miniconda、Python、Jupyter Lab、Ollama等) 大模型应用研发的第一步,就是研发环境的配置,好的工具和环境是提升研发效率的关键,最基础的配置包括Miniconda包管理器、Python SDK、Jupyter Lab WebIDE、Node.js SDK、Ollama本地模型管理器、Ollama WebUI可视化对话界面等…… 阅读全文
posted @ 2024-06-25 23:15 老牛啊 阅读(326) 评论(0) 推荐(0) 编辑
摘要: Phi-3 模型手机部署教程(微软发布的可与GPT-3.5媲美的小模型) Phi 是微软AI研究院新推出的开源小型语言模型,适用于商业使用,其优势在于体积小、资源需求少,被称为“一个能跑在手机上的大模型”,我们通过Termux和Ollama工具,在我们手机上部署和体验…… 阅读全文
posted @ 2024-06-23 10:12 老牛啊 阅读(647) 评论(0) 推荐(0) 编辑
摘要: [AI资讯·0622] Claude3.5超越GPT-4o,360推出AI搜索,OpenAI收购Rockset,华为发布大模型 360推出AI搜索、浏览器及甄选平台,通过流量曝光优秀AI工具,OpenAI收购Rockset实时数据分析能力,华为发布盘古大模型5.0,Anthropic推出Claude3.5超越OpenAI的GPT-4o,华为发布自研编程语言仓颉,提供AI辅助工具,国内科技公司竞争核心在于持续吸引顶尖AI人才…… 阅读全文
posted @ 2024-06-22 14:53 老牛啊 阅读(126) 评论(0) 推荐(0) 编辑
摘要: ngrok内网穿透,实现外网访问ChatTTS/Qwen2等大模型应用 我们编写好的应用程序、或者本地部署的大模型,想临时分享给外网访问以进行功能演示,通过ngrok内网穿透软件,可以快速满足我们的需求…… 阅读全文
posted @ 2024-06-22 14:14 老牛啊 阅读(7) 评论(0) 推荐(0) 编辑
摘要: Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程,轻松实现AI绘图自由 Stability AI正式开源了Stable Diffusion 3 Medium 文生图大模型,它仅20亿参数,就能够生成更高质量和更细腻的图片;因模型尺寸较小,它适合在个人PC、笔记本电脑上运行。老牛同学手把手部署和体验SD3…… 阅读全文
posted @ 2024-06-18 20:10 老牛啊 阅读(2148) 评论(0) 推荐(0) 编辑

奔跑的蜗牛 博客:https://ntopic.cn