Swin transformer--mmsegmentation v1.0环境配置和训练(pascal voc数据集)
本文选用mmlab的mmsegmentationv1.1.0的语义分割为例
1.配置环境要求
官网中的最低要求为cuda10.2+、pytorch1.8+、python3.7+.
配置mmsegmentation的环境主要是mmengine/mmcv/mmsegmentation的版本对应
最新安装文档,官方推荐使用mim进行安装,由于部分原因直接按照可能导致版本不对应。
mmsegmentation/docs/en/get_started.md at Main ·开放式实验室/毫米分割 ·GitHub
推荐手动进行指定版本进行安装减少报错。
mmcv | Installation — mmcv 2.1.0 documentation |
---|---|
mmengine | pip install mmengine==0.8.2 |
mmsegmentation | pip install mmsegmentation==1.1.1 |
mmcv可以通过手动下载.whl文件进行安装使用,下面是cu10.2+torch1.8的网站,根据自己的版本修改即可:
download.openmmlab.com/mmcv/dist/cu102/torch1.8/index.html
2.查看下载mmsegmantation文件中的环境需求版本
在./mmseg/__init__的目录下查看:
3.自己电脑的配置环境,亲测成功(windows)
version1 | version2 | |
---|---|---|
cuda | 11.8 | 10.2 |
torch | 2.0.0 | 1.8.0 |
torchvision | 0.15.1 | 0.9.0 |
mmcv | 2.0.1 | 2.0.1 |
mmengine | 0.8.2 | 0.9.0 |
mmsegmentation | 1.1.1 | 1.1.0 |
4.训练自己的数据集(pascal voc数据集格式)
- pascal voc数据集的准备
将labelme标注好的数据文件进行转换格式
文件夹 | 存放内容 |
---|---|
ImageSets | train.txt/val.txt |
JPEGImages | .jpg格式的原图 |
SegmentationClass | .png格式的mask掩码图 |
-
修改数据集位置
configs_base_/datasets/pascal_voc12.py
-
修改类别以及对应的调色板
file_path:mmseg/datasets/voc.py
file_path:mmseg/utils/class_names.py
-
修改训练的类别个数
文中使用下面路径中的文件作为参数配置文件:
file_path:"configs/swin/swin-tiny-patch4-window7_upernet_1xb8-20k_levir-256x256.py
下面的路径修改训练的类别个数:
file_path:./base/models/upernet_swin.py
-
训练的python命令
python ./tools/train.py configs/swin/swin-small-patch4-window7-in1k-pre_upernet_8xb2-160k_ade20k-512x512.py --work-dir /VisualGroup/share/qian/save_model/shang_gong_zhuang/chatou/2310201 --amp
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话