09 2024 档案

摘要:引子 前阵子,阿里Qwen2-VL刚刚闪亮登场,感兴趣的小伙伴可以移步https://blog.csdn.net/zzq1989_/article/details/142332651?spm=1001.2014.3001.5501。这第一的宝座还没坐多久,自家兄弟Ovis1.6版本就来了,20240 阅读全文
posted @ 2024-09-30 09:41 要养家的程序猿 阅读(289) 评论(0) 推荐(0) 编辑
摘要:​ 引子 写了那么多篇大模型环境搭建推理部署的blog,如果没记错有几篇就是因为GPU资源hold不住,没有无法得到最终结果的(智谱AI GLM-4V-9B视觉大模型环境搭建&推理-CSDN博客)。我个人一直觉得大模型发展最终还是要走向端侧,小型化,只是也许没那么快来到。但是这个方向还是一直要有人坚 阅读全文
posted @ 2024-09-23 09:21 要养家的程序猿 阅读(511) 评论(0) 推荐(0) 编辑
摘要:​引子 2024年8月30号,阿里推出Qwen2-VL,开源了2B/7B模型,处理任意分辨率图像无需分割成块。之前写了一篇Qwen-VL的博客,感兴趣的童鞋请移步(Qwen-VL环境搭建&推理测试-CSDN博客),这么小的模型,显然我的机器是跑的起来的,OK,那就让我们开始吧。 一、模型介绍 Qwe 阅读全文
posted @ 2024-09-18 14:37 要养家的程序猿 阅读(2016) 评论(0) 推荐(0) 编辑
摘要:​引子 很少关注360开源的代码,最近360AI团队开源了最新视频模型FancyVideo,据说RTX3090可跑。可以在消费级显卡 (如 GeForce RTX 3090) 上生成任意分辨率、任意宽高比、不同风格、不同运动幅度的视频,其衍生模型还能够完成视频扩展、视频回溯的功能,一种基于 UNet 阅读全文
posted @ 2024-09-09 16:37 要养家的程序猿 阅读(28) 评论(0) 推荐(0) 编辑
摘要:​引子 一口气生成2万字,大模型输出也卷起来了!清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下,输出结果直接从1800字增加到7800字,翻4倍。大模型的生成内容一般都不会太长,这对于内容创作、问题回答等都存在影响,可能导致模型回答问题不全面、创造性能降低等。 阅读全文
posted @ 2024-09-02 11:44 要养家的程序猿 阅读(76) 评论(0) 推荐(0) 编辑