2024 年 8月 1 日随笔档案 - 脂环

2024年8月1日

摘要： Motivation & Abs 近年来，大语言模型在视觉方面取得了极大的进步，但其如何完成定位任务（如word grounding等）仍然不清楚。本文旨在设计一种模型能够将一系列点/边界框作为输入或者输出。当模型接受定位信息作为输入时，可以进行以定位为condition的captioning。当生阅读全文

posted @ 2024-08-01 17:12 脂环阅读(31) 评论(0) 推荐(0) 编辑

公告

昵称：脂环
园龄： 5年11个月
粉丝： 85
关注： 31

+加关注

Loading

脂环

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论