2024 年 5月 30 日随笔档案 - 穷酸秀才大草包

2024年5月30日

CogVLM: Visual Expert For Large Language Models

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ABSTRACT 我们介绍了CogVLM，一个强大的开源视觉语言基础模型。与流行的将图像特征映射到语言模型输入空间的浅层对齐方法不同，CogVLM在注意力层和FFN层通过可训练的视觉专家模块弥合了冻结的预训练语言模型和图像编码器之间的差距阅读全文

posted @ 2024-05-30 19:15 穷酸秀才大草包阅读(101) 评论(0) 推荐(0) 编辑

穷酸秀才大艹包

导航

公告