2024 年 8月 10 日随笔档案 - 海_纳百川

2024年8月10日

摘要： Vision Transformer (ViT) 分类标识符 Vision Transformer (ViT) 分类标识符 1. 初始化分类标识符在ViT中，分类标识符是一个可学习的向量，通常在模型初始化时随机初始化。这个标识符的维度与图像块的嵌入向量维度相同，通常记作 zcls，其大小为 D（与阅读全文

posted @ 2024-08-10 21:52 海_纳百川阅读(26) 评论(0) 推荐(0) 编辑

transformer的位置编码具体是如何做的

摘要： Vision Transformer (ViT) 位置编码 Vision Transformer (ViT) 位置编码 1. 生成位置编码对于每个图像块（patch），根据其位置生成一个对应的编码向量。假设每个图像块的嵌入向量维度为 D，则位置编码的维度也是 D。 ViT 通常使用可学习的绝对位置阅读全文

posted @ 2024-08-10 17:58 海_纳百川阅读(108) 评论(0) 推荐(0) 编辑

不积跬步无以至千里

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己

公告

不积跬步无以至千里

研究领域：深度学习，图像处理 联系方式：vladimirputin@foxmail.com 不必高看自己，也不必贬低自己

公告

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己