会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
CV技术指南(微信公众号)
博客园
首页
新随笔
联系
订阅
管理
2024年5月7日
CVPR 2024 | 字节提出视觉基础模型:ViTamin,实现多项SOTA!
摘要: 前言 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。 本文转载自量子位(QbitAI) 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
阅读全文
posted @ 2024-05-07 22:33 CV技术指南(公众号)
阅读(837)
评论(0)
推荐(0)
编辑
公告