会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
指间的执着
博客园
首页
新随笔
联系
订阅
管理
07 2023 档案
Vision Transformer(VIT)
摘要:VIT主要用于分类任务 一、VIT,即纯transformer模型 图1 VIT 架构 VIT模型的架构如图1所示。主要分为三个步骤: 1. 首先将输入的图片分成patches(如16*16的patch),然后将每个patch输入到Embedding层(即Linear Projection of F
阅读全文
posted @
2023-07-03 22:11
指间的执着
阅读(307)
评论(0)
推荐(0)
编辑
公告