摘要: 太卷了,阿里云免费1个月大模型算力额度,玩转Llama3.1/Qwen2等训练推理 阿里云百炼平台发布推文,提供30天免费算力额度,助力玩转 Llama3.1 训练推理。老牛同学首当其冲,去体验一把,本文详细记录了整个过程,同时给出了老牛同学的一些想法,欢迎交流学习…… 阅读全文
posted @ 2024-07-27 01:35 老牛啊 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 基于 Qwen2 大模型微调技术详细教程(LoRA 参数高效微调和 SwanLab 可视化监控) 本教程详细介绍了 LoRA 参数高效微调技术,包括数据集准备和处理、模型加载、参数设置等,然后以 Qwen2-0.5B 预训练模型实践,进行了文本分类能力微调,微调过程通过 SwanLab 可视化界面查看,最终微调模型进行测试数据评估…… 阅读全文
posted @ 2024-07-20 00:29 老牛啊 阅读(413) 评论(1) 推荐(1) 编辑
摘要: LivePortrait 数字人:开源的图生视频模型,本地部署和专业视频制作详细教程 数字人最近比较火,LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型,比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程,详细介绍如何在本地部署和生成专业视频…… 阅读全文
posted @ 2024-07-14 13:52 老牛啊 阅读(324) 评论(0) 推荐(0) 编辑
摘要: Ollama完整教程:本地LLM管理、WebUI对话、Python/Java客户端API应用 Ollama可以非常方便的管理和部署我们本地大语言模型,老牛同学希望通过本文对Ollama进行一次详细介绍,包括本地大模型管理和使用、WebUI对话界面部署、通过Python和Java使用Ollama的API接口等…… 阅读全文
posted @ 2024-07-10 23:25 老牛啊 阅读(5603) 评论(1) 推荐(5) 编辑
摘要: 基于Qwen2/Lllama3等大模型,部署团队私有化RAG知识库系统的详细教程(Docker+AnythingLLM) 大语言模型在垂直细分领域存在知识局限、幻觉、数据安全等一些问题,可通过RAG(检索增强生成)方案来解决。本文基于AnythingLLM框架,搭建团队私有知识库系统,并进行使用和验证,RAG系统在保留输出的有效性同时,还保留了创造性…… 阅读全文
posted @ 2024-07-06 15:51 老牛啊 阅读(628) 评论(0) 推荐(0) 编辑
摘要: 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阿里Qwen2-72B大模型已是开源榜的王者,为什么还要推出其他参数模型,被其他模型打榜? 阅读全文
posted @ 2024-07-04 23:09 老牛啊 阅读(177) 评论(0) 推荐(0) 编辑
摘要: Google 发布了最新的开源大模型 Gemma 2,本地快速部署和体验 Google 重磅发布了最新版大语言模型Gemma 2,其中 90亿 参数版本适合我们个人在笔记本本地部署,老牛同学通过本文和大家一起,通过2种方式快速部署和体验,当然这2种快速部署模型的方式,也同样适用于其他大模型…… 阅读全文
posted @ 2024-07-02 23:12 老牛啊 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 使用Llama3/Qwen2等开源大模型,部署团队私有化Code Copilot和使用教程 代码辅助工具(Code Copilot)可以提高团队代码研发效率,能有效帮助产品快速上市抢占先发优势,但同时又需要保证代码和信息隐私,私有化Code Copilot是保护隐私的重要手段。老牛通过本文,详细介绍通过开源大模型,部署私有化Code Copilot和使用教程…… 阅读全文
posted @ 2024-06-30 01:06 老牛啊 阅读(463) 评论(0) 推荐(0) 编辑
摘要: 大模型应用研发基础环境配置(Miniconda、Python、Jupyter Lab、Ollama等) 大模型应用研发的第一步,就是研发环境的配置,好的工具和环境是提升研发效率的关键,最基础的配置包括Miniconda包管理器、Python SDK、Jupyter Lab WebIDE、Node.js SDK、Ollama本地模型管理器、Ollama WebUI可视化对话界面等…… 阅读全文
posted @ 2024-06-25 23:15 老牛啊 阅读(107) 评论(0) 推荐(0) 编辑
摘要: Phi-3 模型手机部署教程(微软发布的可与GPT-3.5媲美的小模型) Phi 是微软AI研究院新推出的开源小型语言模型,适用于商业使用,其优势在于体积小、资源需求少,被称为“一个能跑在手机上的大模型”,我们通过Termux和Ollama工具,在我们手机上部署和体验…… 阅读全文
posted @ 2024-06-23 10:12 老牛啊 阅读(214) 评论(0) 推荐(0) 编辑
摘要: [AI资讯·0622] Claude3.5超越GPT-4o,360推出AI搜索,OpenAI收购Rockset,华为发布大模型 360推出AI搜索、浏览器及甄选平台,通过流量曝光优秀AI工具,OpenAI收购Rockset实时数据分析能力,华为发布盘古大模型5.0,Anthropic推出Claude3.5超越OpenAI的GPT-4o,华为发布自研编程语言仓颉,提供AI辅助工具,国内科技公司竞争核心在于持续吸引顶尖AI人才…… 阅读全文
posted @ 2024-06-22 14:53 老牛啊 阅读(71) 评论(0) 推荐(0) 编辑
摘要: ngrok内网穿透,实现外网访问ChatTTS/Qwen2等大模型应用 我们编写好的应用程序、或者本地部署的大模型,想临时分享给外网访问以进行功能演示,通过ngrok内网穿透软件,可以快速满足我们的需求…… 阅读全文
posted @ 2024-06-22 14:14 老牛啊 阅读(5) 评论(0) 推荐(0) 编辑
摘要: Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程,轻松实现AI绘图自由 Stability AI正式开源了Stable Diffusion 3 Medium 文生图大模型,它仅20亿参数,就能够生成更高质量和更细腻的图片;因模型尺寸较小,它适合在个人PC、笔记本电脑上运行。老牛同学手把手部署和体验SD3…… 阅读全文
posted @ 2024-06-18 20:10 老牛啊 阅读(1189) 评论(0) 推荐(0) 编辑
摘要: [AI资讯·0618] 快手AI模型可灵在质量优于Sora,OpenAI和谷歌发布新技术推动AI视频推理发展,Gemini1.5Pro在该榜单中表现突出 快手新AI模型"可灵"在视频生成质量上优于Sora,在细节处理、对中国元素理解及适合中国用户方面表现突出;LumaAI同样能生成高质量两分钟视频,具备“电影感”功能以及图片+提示词生成视频的能力;Direct 3D采用3D Diffusion Transformer技术路线;中国首个超长时长、高性价比大模型“视界一粟YiSu”发布,推动视频生成技术发展 阅读全文
posted @ 2024-06-18 08:03 老牛啊 阅读(104) 评论(0) 推荐(0) 编辑
摘要: Qwen2 阿里最强开源大模型(Qwen2-7B)本地部署、API调用和WebUI对话机器人 阿里云正式开源通义千问Qwen2系列模型,其中Qwen2-72B成为全球性能最强的开源模型,在全球权威测评中,性能超过美国最强开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。今天老牛同学部署和体验Qwen2-7B中等尺寸模型,包括本地部署、API嗲用和WebUI对话客户端…… 阅读全文
posted @ 2024-06-12 22:02 老牛啊 阅读(8113) 评论(0) 推荐(1) 编辑

奔跑的蜗牛 博客:https://ntopic.cn