Fork me on GitHub
摘要: 空间思考:多模态大型语言模型如何看待、记忆和回忆空间 VSI-Bench:我们引入了一个高质量的基准,用于评估 MLLM 的 3D、基于视频的视觉空间智能 评估:我们在开源和闭源 MLLM 上对 VSI-Bench 进行了评估,发现 MLLM 表现出有竞争力的(尽管不如人类)视觉空间智能。 语言分析 阅读全文
posted @ 2025-01-08 17:07 stardsd 阅读(29) 评论(0) 推荐(0) 编辑