要养家的程序猿

2024年11月25日

摘要：引子毫无疑问，多智能体肯定是 AI 未来重要的研究方向之一，前阵子OpenAI可算是再Open一回，开源了多智能体框架Swarm。OpenAI开源的东西自然引来了极大的关注。OK，我们开始吧一、模型介绍 Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。为此，它使用了两阅读全文

posted @ 2024-11-25 09:17 要养家的程序猿阅读(216) 评论(0) 推荐(0)

2024年11月18日

上海AI Lab Mono-InternVL环境搭建&推理测试

摘要：引子原生多模态大模型性能瓶颈，迎来新突破！上海AI Lab代季峰老师团队，提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比，该模型首个单词延迟最多降低67%，在多个评测数据集上均达到了SOTA水准。OK，那就让我们开始吧。一、模型介绍将视觉编码和文本解码集成到一个单一阅读全文

posted @ 2024-11-18 10:24 要养家的程序猿阅读(244) 评论(0) 推荐(0)

2024年11月11日

D-FINE环境搭建&推理测试

摘要：引子在目标检测领域，内卷严重的实时目标检测 (Real-time Object Detection) 领域，性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略，导致性能逐渐趋于饱和。前阵子YOLOv11横空出世（感兴趣的童鞋可以移步YOLOv1 阅读全文

posted @ 2024-11-11 09:10 要养家的程序猿阅读(1145) 评论(0) 推荐(1)

2024年11月4日

智谱AI Emu3环境搭建&推理测试

摘要：引子 OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点：只要能够非常好的预测下一个token，就能帮助人类达到通用人工智能（AGI）。虽然，下一token预测已在大语言模型领域实现了ChatGPT等突破，但是在多模态模型中的适用性仍不明确。多模态任务仍然由扩散模阅读全文

posted @ 2024-11-04 09:05 要养家的程序猿阅读(140) 评论(0) 推荐(0)

2024年10月28日

CogView3环境搭建&推理测试

摘要：引子清华智谱的开源模型也写了很多个了。盘一下，发现少了文生图的模型，刚好CogView3发布，一看只有3B参数，好嘞，就它了。OK，我们开始吧。一、模型介绍 CogView是一个文生图的开源大模型，它需要强大的生成模型和跨模态理解。CogView-3-Plus 在 CogView3（ECCV 阅读全文

posted @ 2024-10-28 09:10 要养家的程序猿阅读(191) 评论(0) 推荐(0)

2024年10月21日

YOLOv11环境搭建&推理测试

摘要：引子 2024年9月30日，Ultralytics在其活动YOLOVision中正式发布了YOLOv 11。YOLOv 11是由位于美国和西班牙的Ultralytics团队开发的YOLO的最新版本。几个月前YOLOv10发布（感兴趣的童鞋可以移步https://blog.csdn.net/zzq19 阅读全文

posted @ 2024-10-21 09:40 要养家的程序猿阅读(3230) 评论(0) 推荐(0)

2024年10月14日

Qwen2.5环境搭建&推理测试

摘要：引子 2024年9月19号，阿里推出Qwen2.5全家桶，各种尺寸的都有。9月29日消息，基准测试平台Chatbot Arena日前公布最新大模型盲测榜单，10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十，是前阅读全文

posted @ 2024-10-14 15:08 要养家的程序猿阅读(1794) 评论(0) 推荐(0)

2024年10月8日

上海AI Lab视频生成大模型书生.筑梦环境搭建&推理测试

摘要：引子最近视频生成大模型层出不穷，上海AI Lab推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍，书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视频生成大模型。OK，那就让我们开始吧。一、模型介绍筑梦 2.0 支持 5s-20s 阅读全文

posted @ 2024-10-08 10:01 要养家的程序猿阅读(214) 评论(0) 推荐(0)

2024年9月30日

Ovis1.6-9B视觉大模型环境搭建&推理

摘要：引子前阵子，阿里Qwen2-VL刚刚闪亮登场，感兴趣的小伙伴可以移步https://blog.csdn.net/zzq1989_/article/details/142332651?spm=1001.2014.3001.5501。这第一的宝座还没坐多久，自家兄弟Ovis1.6版本就来了，20240 阅读全文

posted @ 2024-09-30 09:41 要养家的程序猿阅读(409) 评论(0) 推荐(0)

2024年9月23日

MiniMind环境搭建&训练推理测试

摘要：引子写了那么多篇大模型环境搭建推理部署的blog，如果没记错有几篇就是因为GPU资源hold不住，没有无法得到最终结果的（智谱AI GLM-4V-9B视觉大模型环境搭建&推理-CSDN博客）。我个人一直觉得大模型发展最终还是要走向端侧，小型化，只是也许没那么快来到。但是这个方向还是一直要有人坚阅读全文

posted @ 2024-09-23 09:21 要养家的程序猿阅读(1198) 评论(0) 推荐(0)

nick-algorithmer

公告