2024 年 12月 11 日随笔档案 - 脂环

2024年12月11日

摘要： Motivation & Abs 之前的MLLM通常使用预定义的固定分辨率，Qwen2-VL引入了朴素动态分辨率，使模型能够生成更高效、更准确的视觉表示，与人类感知过程紧密结合。同时，模型还使用了多模态旋转位置编码（M-RoPE），促进了不同模态信息的有效融合。同时，作者使用了统一的范式处理图像和视阅读全文

posted @ 2024-12-11 14:08 脂环阅读(422) 评论(0) 推荐(0) 编辑

公告

昵称：脂环
园龄： 5年11个月
粉丝： 85
关注： 31

+加关注

Loading

脂环

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论