摘要: GeoChat 任务 图像级对话任务 在此任务中,GeoChat 处理图像和用户文本查询,利用图像的全局上下文执行对话的任务。 区域级对话任务 在图像输入中向 GeoChat 提供空间框位置 ( b ),指导模型关注图像中的特定区域,执行区域级的对话任务。 具体化对话任务 通过使用特殊的标记,引导G 阅读全文
posted @ 2024-10-29 22:24 陈用饼 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 2024年9月学习月报 一、学习目标 学习 VLM 的基本原理和架构,理解视觉和语言信息的融合方式,掌握 VLM 的训练方式与评估方法。 学习 VLM 在遥感领域的应用(RemoteCLIP、ChangeCLIP),并尝试本地复现。 二、学习内容 文献 An Introduction to Vision-Language 阅读全文
posted @ 2024-10-09 02:48 陈用饼 阅读(50) 评论(0) 推荐(0) 编辑