11 2024 档案
摘要:引子 毫无疑问,多智能体肯定是 AI 未来重要的研究方向之一,前阵子OpenAI可算是再Open一回,开源了多智能体框架Swarm。OpenAI开源的东西自然引来了极大的关注。OK, 我们开始吧 一、模型介绍 Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。为此,它使用了两
阅读全文
摘要:引子 原生多模态大模型性能瓶颈,迎来新突破!上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。OK,那就让我们开始吧。 一、模型介绍 将视觉编码和文本解码集成到一个单一
阅读全文
摘要: 引子 在目标检测领域,内卷严重的实时目标检测 (Real-time Object Detection) 领域,性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略,导致性能逐渐趋于饱和。前阵子YOLOv11横空出世(感兴趣的童鞋可以移步YOLOv1
阅读全文
摘要:引子 OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点:只要能够非常好的预测下一个token,就能帮助人类达到通用人工智能(AGI)。虽然,下一token预测已在大语言模型领域实现了ChatGPT等突破,但是在多模态模型中的适用性仍不明确。多模态任务仍然由扩散模
阅读全文