2024 年 6月 18 日随笔档案 - 脂环

2024年6月18日

F-LMM: Grounding Frozen Large Multimodal Models

摘要： Motivation & Abs 为现有的多模态大模型引入visual grounding的能力能够增强AI对世界以及人机交互的理解，然而现有的方法通常需要对LLM的参数进行FT以学习额外的seg token，同时过拟合grounding和segmentation的数据集，这会导致对于通用知识以及指阅读全文

posted @ 2024-06-18 22:33 脂环阅读(75) 评论(0) 推荐(0) 编辑

公告

昵称：脂环
园龄： 6年
粉丝： 85
关注： 31

+加关注

Loading

脂环

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论