摘要: CNN由于卷积操作的局部性,难以学习全局和长范围的语义信息。交互。 提出swin-unet,是一个像Unet的纯transformer,用于医学图像分割。采用层级的带移动窗口的swin transformer作为编码器,提取上下文特征。一个对称的、带有patch展开层的、基于swin-transformer的解码器用于上采样操作,恢复特征图的空间分辨率。 在直接下采样输入和上采样输出4倍时,在多器官和心脏分割任务上证明,提出的网络超过了全卷积或卷积和transformer的结合方法。模型和代码将公开在:https://github.com/HuCaoFighting/Swin-Unet 阅读全文
posted @ 2021-05-21 15:23 一点飞鸿 阅读(2132) 评论(0) 推荐(0) 编辑
摘要: Swin Transformer能够兼容广泛的视觉任务,包括图像分类(在ImageNet-1K的最高准确率86.4)和高密度预测任务,如目标检测(在COCO test-dev数据上58.7 box AP和51.1 mask AP)和语义分割(在ADE20K val上53.5 mIoU)。它在coco数据上,比之前的sota模型多2.7个box ap,2.6个mask ap,在ADE20K上,比之前sota多3.2个mIoU。 代码:https://github.com/microsoft/Swin-Transformer 阅读全文
posted @ 2021-05-21 14:55 一点飞鸿 阅读(1373) 评论(0) 推荐(0) 编辑