摘要:
GeoChat 任务 图像级对话任务 在此任务中,GeoChat 处理图像和用户文本查询,利用图像的全局上下文执行对话的任务。 区域级对话任务 在图像输入中向 GeoChat 提供空间框位置 ( b ),指导模型关注图像中的特定区域,执行区域级的对话任务。 具体化对话任务 通过使用特殊的标记,引导G 阅读全文
摘要:
一、学习目标 学习 VLM 的基本原理和架构,理解视觉和语言信息的融合方式,掌握 VLM 的训练方式与评估方法。 学习 VLM 在遥感领域的应用(RemoteCLIP、ChangeCLIP),并尝试本地复现。 二、学习内容 文献 An Introduction to Vision-Language 阅读全文