摘要: 前言 近日,香港中文大学多媒体实验室(CUHK MMLab)联合上海人工智能实验室的OpenGVLAB研究团队提出一个统一多模态学习框架 Meta-Transformer,实现骨干网络的大一统,具有一个模态共享编码器,并且无需配对数据,即可理解 12 种模态信息, 并提供了多模态无边界融合的新范式。 阅读全文
posted @ 2023-07-28 14:37 CV技术指南(公众号) 阅读(161) 评论(0) 推荐(0) 编辑