Swin transformer--mmsegmentation v1.0环境配置和训练(pascal voc数据集)

本文选用mmlab的mmsegmentationv1.1.0的语义分割为例

1.配置环境要求

官网中的最低要求为cuda10.2+、pytorch1.8+、python3.7+.

配置mmsegmentation的环境主要是mmengine/mmcv/mmsegmentation的版本对应

最新安装文档,官方推荐使用mim进行安装,由于部分原因直接按照可能导致版本不对应。

mmsegmentation/docs/en/get_started.md at Main ·开放式实验室/毫米分割 ·GitHub

推荐手动进行指定版本进行安装减少报错。

mmcv Installation — mmcv 2.1.0 documentation
mmengine pip install mmengine==0.8.2
mmsegmentation pip install mmsegmentation==1.1.1

mmcv可以通过手动下载.whl文件进行安装使用,下面是cu10.2+torch1.8的网站,根据自己的版本修改即可:

download.openmmlab.com/mmcv/dist/cu102/torch1.8/index.html

2.查看下载mmsegmantation文件中的环境需求版本

在./mmseg/__init__的目录下查看:

3.自己电脑的配置环境,亲测成功(windows)

version1 version2
cuda 11.8 10.2
torch 2.0.0 1.8.0
torchvision 0.15.1 0.9.0
mmcv 2.0.1 2.0.1
mmengine 0.8.2 0.9.0
mmsegmentation 1.1.1 1.1.0

4.训练自己的数据集(pascal voc数据集格式)

  • pascal voc数据集的准备

将labelme标注好的数据文件进行转换格式

文件夹 存放内容
ImageSets train.txt/val.txt
JPEGImages .jpg格式的原图
SegmentationClass .png格式的mask掩码图
  • 修改数据集位置

    configs_base_/datasets/pascal_voc12.py
    img

  • 修改类别以及对应的调色板

    file_path:mmseg/datasets/voc.py
    img
    file_path:mmseg/utils/class_names.py
    img

    img

  • 修改训练的类别个数

    文中使用下面路径中的文件作为参数配置文件:

    file_path:"configs/swin/swin-tiny-patch4-window7_upernet_1xb8-20k_levir-256x256.py

    下面的路径修改训练的类别个数:

    file_path:./base/models/upernet_swin.py

    img

  • 训练的python命令

    python ./tools/train.py
    configs/swin/swin-small-patch4-window7-in1k-pre_upernet_8xb2-160k_ade20k-512x512.py
    --work-dir /VisualGroup/share/qian/save_model/shang_gong_zhuang/chatou/2310201
    --amp
posted @   小脚冰凉吖  阅读(269)  评论(3编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话
点击右上角即可分享
微信分享提示