摘要: SmolVLM是专为资源受限设备设计的一系列小型高效多模态模型。尽管模型规模较小,但通过精心设计的架构和训练策略,SmolVLM在图像和视频处理任务上均表现出接近大型模型的性能水平,为实时、设备端应用提供了强大的视觉理解能力。 SmolVLM架构设计 该研究系统性地探索了小型多模态模型的设计选择与权 阅读全文
posted @ 2025-04-21 13:00 deephub 阅读(35) 评论(0) 推荐(0)