摘要: 0、图文多模态学习 包含以下: 普通多模态学习,如图文检索、视觉问答、视觉推理、视觉蕴含: CLIP language guided detection language guided segmentation 文本图像生成:Dall.E2, Stable Diffusion 文本视频生成 1、普通 阅读全文
posted @ 2022-12-16 19:20 哈哈哈喽喽喽 阅读(268) 评论(0) 推荐(0) 编辑