AI算法 - 随笔分类 - 要养家的程序猿

京东JoyAgent环境搭建与推理测试

摘要：一、引子有几个月没有写blog了，主要原因这几个月工作变动，没有腾出时间来。最近在搞rag、agent这些东西，越深入发现遇到的问题就越多，常见的开源dify，ragflow这些总存在这样或者那样的问题，再解决实际问题的时候，总觉得差点意思，尤其在需要结合到数据分析领域的时候，感觉还是比较薄弱。做阅读全文

posted @ 2025-09-29 09:00 要养家的程序猿阅读(135) 评论(0) 推荐(0)

AgenticSeek环境搭建&推理测试

摘要：引子今天看到一篇博客写道《不是ManusAI用不起，而是AgenticSeek更有性价比，炸裂的项目，100%本地运行的AI秘书，真的丝滑啦！》，Manus是噱头还是真经我今天不讨论，但是这个AgenticSeek在GitHub上16.9k的Star，还是有点东西，本地化运行的Manus替代方案，阅读全文

posted @ 2025-06-16 17:31 要养家的程序猿阅读(485) 评论(0) 推荐(0)

RagFlow优化&代码解析(二)

摘要：引子前文写到RagFlow优化&代码解析(一)，感兴趣的童鞋可以移步（https://blog.csdn.net/zzq1989_/article/details/148055465）。上一篇主要写了检索优化以及整体代码结构和流程。这一篇打算重点写下LLM相关的代码解析。OK，那我们开始吧。一、阅读全文

posted @ 2025-06-09 09:36 要养家的程序猿阅读(508) 评论(0) 推荐(0)

RagFlow优化&代码解析（一）

摘要：引子前文写到RagFlow的环境搭建&推理测试，感兴趣的童鞋可以移步（https://blog.csdn.net/zzq1989_/article/details/148055465）。前文也写过RagFLow参数配置&测试的文档，详见（https://blog.csdn.net/zzq1989_ 阅读全文

posted @ 2025-06-03 10:11 要养家的程序猿阅读(2661) 评论(0) 推荐(0)

RagFlow参数配置&测试

摘要：引子前文写到RagFlow的环境搭建&推理测试，感兴趣的童鞋可以移步（https://blog.csdn.net/zzq1989_/article/details/148055465）。RagFlow相对于其他Rag开源项目，比如说MaxKB，Dify项目部署较为复杂。很多读者私信说我写了那么多环阅读全文

posted @ 2025-05-27 13:22 要养家的程序猿阅读(2737) 评论(0) 推荐(0)

DFloat11环境搭建&推理测试

摘要：引子很少关注大模型压缩这个领域，碰巧碰上了，那就来吧。为了应对 LLM 不断增长的模型尺寸，通常会采用量化技术，将高精度权重转换为低位表示。这显著减少了内存占用和计算需求，有助于在资源受限的环境中实现更快的推理和部署。然而，量化本质上是一种有损压缩技术，引入了一个基本缺点：它不可避免地改变了 LL 阅读全文

posted @ 2025-05-12 09:10 要养家的程序猿阅读(109) 评论(0) 推荐(0)

Qwen3环境搭建&推理测试

摘要：引子 2025年4月29日，阿里推出Qwen3，模型依旧采用宽松的 Apache2.0 协议开源，全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用，也可以通过阿里云百炼调用 Qwen3 的 API 服务，具体来讲，Qwen3 系列模型包含两款 MoE 模型阅读全文

posted @ 2025-05-06 10:08 要养家的程序猿阅读(967) 评论(0) 推荐(0)

Dia-1.6B环境搭建&推理测试

摘要：引子一直在语音方面没有涉及，碰巧看到一则新闻，一个刚刚在 X、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话，同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。由于效果过于逼真，很好，吸引了我的注意。那就语音试水第一篇。OK，那就让我们开始吧。一、模型介绍阅读全文

posted @ 2025-04-28 14:05 要养家的程序猿阅读(161) 评论(0) 推荐(0)

Qwen2.5-VL环境搭建&推理测试

摘要：引子 2025年春节期间，阿里推出Qwen2.5-VL，开源了3B、7B、72B模型，，能够处理图像和文本的联合任务，如图像描述生成、视觉问答（VQA）、图文匹配等。。之前写了一篇Qwen2-VL的博客，感兴趣的童鞋请移步（https://blog.csdn.net/zzq1989_/article 阅读全文

posted @ 2025-04-21 09:28 要养家的程序猿阅读(1761) 评论(0) 推荐(0)

Dream 7B推理模型环境搭建&推理测试

摘要：引子语言是离散的，所以适合用自回归模型来生成；而图像是连续的，所以适合用扩散模型来生成。在生成模型发展早期，这种刻板印象广泛存在于很多研究者的脑海中。写了那么多主流自回归的大模型部署文档，刚巧碰到这篇反其道而行的基于扩散模型的大模型。挺有意思，OK，那就让我们开始吧。一、模型介绍最近，更多的研阅读全文

posted @ 2025-04-14 09:08 要养家的程序猿阅读(162) 评论(0) 推荐(0)

阿里QWQ-32B环境搭建&推理测试

摘要：引子当政企都在热衷于本地部署满血DeepSeek-R1，阿里重磅开源了 QwQ。当大部分人玩不起 671B 的满血，32B 的 QwQ 已让全球开发者陷入狂欢。消费级显卡就能跑，堪称推理模型天花板！QwQ 的评价之所以这么高，主要基于两点：效果比肩满血DeepSeek-R1；仅用 32B 参数，阅读全文

posted @ 2025-04-07 09:55 要养家的程序猿阅读(186) 评论(0) 推荐(0)

通义万相环境搭建&推理测试

摘要：引子 2月25日，阿里云旗下视觉生成基座模型万相 2.1（Wan）重磅开源，此次开源采用最宽松的 Apache2.0 协议，14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务。ds的火热，都快把这则消息掩盖了。作为长期关注大模型，多模态的blogger，我阅读全文

posted @ 2025-03-31 10:18 要养家的程序猿阅读(262) 评论(0) 推荐(0)

VLM-R1环境搭建&推理测试

摘要：引子前文也写了DeepSeek R1模型的安装测试，感兴趣的童鞋移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502）。那么在多模态方面R1方法（GRPO，Group Relative 阅读全文

posted @ 2025-03-25 15:56 要养家的程序猿阅读(513) 评论(0) 推荐(0)

Qwen2-VL华为卡300i duo环境搭建&推理测试

摘要：引子前面也写过华为300i duo DeepSeek的环境搭建&推理测试，感兴趣的同事请移步（https://blog.csdn.net/zzq1989_/article/details/146149684?spm=1001.2014.3001.5501）。多模态华为卡的适配倒是一直没有出过相关的阅读全文

posted @ 2025-03-17 11:56 要养家的程序猿阅读(1025) 评论(0) 推荐(0)

DeepSeek-R1华为卡300i Duo环境搭建&推理测试

摘要：引子前文已经写了不少DeepSeek相关的文章，感兴趣的童鞋可以移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502，https://blog.csdn.net/zzq1989_/ar 阅读全文

posted @ 2025-03-10 11:54 要养家的程序猿阅读(923) 评论(2) 推荐(0)

YOLOv12环境搭建&推理测试

摘要：引子 2025年2月18日，YOLOv 12横空出世，我记得上次YOLO发布还是上次（哈哈！）。几个月前YOLOv11发布（感兴趣的童鞋可以移步https://blog.csdn.net/zzq1989_/article/details/143104284?spm=1001.2014.3001.55 阅读全文

posted @ 2025-03-03 09:28 要养家的程序猿阅读(987) 评论(0) 推荐(0)

Sa2VA环境搭建&推理测试

摘要：引子 Sa2VA模型通过结合SAM-2和LLaVA，将文本、图像和视频统一到共享的LLM标记空间中，能够在少量指令微调下执行多种任务，如图像/视频对话、指称分割和字幕生成。该模型在视频编辑和内容创作中展现出强大的性能，在相关基准任务中达到了SOTA水平。OK，那就让我们开始吧。一、模型介绍 Sa2 阅读全文

posted @ 2025-02-24 14:50 要养家的程序猿阅读(201) 评论(0) 推荐(0)

基于Ollama的win10环境下DeepSeek安装测试

摘要：引子之前一篇blog介绍了如何安装DeepSeek，感兴趣的童鞋请移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502）。那篇blog是根据DeepSeek官网安装步骤，只能通过API 阅读全文

posted @ 2025-02-17 09:12 要养家的程序猿阅读(361) 评论(0) 推荐(0)

DeepSeek-Janus-Pro环境搭建&推理测试

摘要：引子北京时间1月28日凌晨，近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型，这是继Janus发布之后的一次较大幅度升级。该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型，Janus-Pro优化了训练策略、扩展了训阅读全文

posted @ 2025-02-10 09:14 要养家的程序猿阅读(577) 评论(0) 推荐(0)

DeepSeek-R1环境搭建&推理测试

摘要：引子这两天国货之光DeepSeek-R1火爆出圈，凑个热闹。过来看看 aha moment（顿悟时刻）的神奇，OK，我们开始吧。一、模型介绍 1月20日，中国AI公司深度求索（DeepSeek）发布的DeepSeek-R1模型，凭借其独特的强化学习（RL）训练方法，首次让AI展现出类人的“顿阅读全文

posted @ 2025-01-30 21:20 要养家的程序猿阅读(526) 评论(0) 推荐(0)

nick-algorithmer

随笔分类 - AI算法

公告