2024 年 5月 31 日随笔档案 - 吴建明wujianming

2024年5月31日

摘要：视觉任务的视觉语言模型研究综述摘要——大多数视觉识别研究在深度神经网络（DNN）训练中严重依赖于人群标记的数据，他们通常为每个视觉识别任务训练一个DNN，导致视觉识别范式既费力又耗时。为了应对这两个挑战，最近对视觉语言模型（VLM）进行了深入研究，该模型从互联网上几乎无限可用的网络级图像-文本对中阅读全文

posted @ 2024-05-31 03:48 吴建明wujianming 阅读(139) 评论(0) 推荐(0) 编辑

吴建明

公告