07 2023 档案

摘要:VIT主要用于分类任务 一、VIT,即纯transformer模型 图1 VIT 架构 VIT模型的架构如图1所示。主要分为三个步骤: 1. 首先将输入的图片分成patches(如16*16的patch),然后将每个patch输入到Embedding层(即Linear Projection of F 阅读全文
posted @ 2023-07-03 22:11 指间的执着 阅读(307) 评论(0) 推荐(0) 编辑