2024 年 9月随笔档案 - 要养家的程序猿

Ovis1.6-9B视觉大模型环境搭建&推理

摘要：引子前阵子，阿里Qwen2-VL刚刚闪亮登场，感兴趣的小伙伴可以移步https://blog.csdn.net/zzq1989_/article/details/142332651?spm=1001.2014.3001.5501。这第一的宝座还没坐多久，自家兄弟Ovis1.6版本就来了，20240 阅读全文

posted @ 2024-09-30 09:41 要养家的程序猿阅读(289) 评论(0) 推荐(0) 编辑

MiniMind环境搭建&训练推理测试

摘要：引子写了那么多篇大模型环境搭建推理部署的blog，如果没记错有几篇就是因为GPU资源hold不住，没有无法得到最终结果的（智谱AI GLM-4V-9B视觉大模型环境搭建&推理-CSDN博客）。我个人一直觉得大模型发展最终还是要走向端侧，小型化，只是也许没那么快来到。但是这个方向还是一直要有人坚阅读全文

posted @ 2024-09-23 09:21 要养家的程序猿阅读(511) 评论(0) 推荐(0) 编辑

Qwen2-VL环境搭建&推理测试

摘要：引子 2024年8月30号，阿里推出Qwen2-VL，开源了2B/7B模型，处理任意分辨率图像无需分割成块。之前写了一篇Qwen-VL的博客，感兴趣的童鞋请移步（Qwen-VL环境搭建&推理测试-CSDN博客），这么小的模型，显然我的机器是跑的起来的，OK，那就让我们开始吧。一、模型介绍 Qwe 阅读全文

posted @ 2024-09-18 14:37 要养家的程序猿阅读(2016) 评论(0) 推荐(0) 编辑

FancyVideo环境搭建&推理

摘要：引子很少关注360开源的代码，最近360AI团队开源了最新视频模型FancyVideo，据说RTX3090可跑。可以在消费级显卡 (如 GeForce RTX 3090) 上生成任意分辨率、任意宽高比、不同风格、不同运动幅度的视频，其衍生模型还能够完成视频扩展、视频回溯的功能，一种基于 UNet 阅读全文

posted @ 2024-09-09 16:37 要养家的程序猿阅读(28) 评论(0) 推荐(0) 编辑

LongWriter环境安装&推理测试

摘要：引子一口气生成2万字，大模型输出也卷起来了！清华&智谱AI最新研究，成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下，输出结果直接从1800字增加到7800字，翻4倍。大模型的生成内容一般都不会太长，这对于内容创作、问题回答等都存在影响，可能导致模型回答问题不全面、创造性能降低等。阅读全文

posted @ 2024-09-02 11:44 要养家的程序猿阅读(76) 评论(0) 推荐(0) 编辑

nick-algorithmer

09 2024 档案

公告