linux(WSL)配置pytorh-gpu运行环境及常见问题

0,为什么要配置linux下的pytorch-gpu运行环境

  • 最大的好处莫过于设置num_workers再也不会因为多进程而报错了!训练时效率的提升不是一点,是好几倍!

1,环境配置

  • python3安装
sudo apt-get update
sudo apt-get upgrade
sudo apt install python3
  • pip3安装
sudo apt install python3-pip
sudo pip3 install --upgrade pip    #pip3更新
pip3 install torch==1.10.0+cu113 torchvision==0.11.1+cu113 torchaudio==0.10.0+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
  • 若在安装过程中出现pillow安装不成功的问题
    • pip3版本太低,升级pip3
    • python3 -m pip install --upgrade pip
      python3 -m pip install --upgrade Pillow
      
  • 若在安装过程中出现报错 ERROR: Cannot uninstall 'xxx'. It is a distutils installed project and thus we cannot accurately
报错 Cannot uninstall 'abcd',那就 pip install --ignore-installed abcd,比如pyyaml
pip3 install --ignore-installed pyyaml
#Successfully installed pyyaml-5.3.1
'安装完成后,再下载自己想要下载的包'
pip3 install serial
#Successfully installed iso8601-0.1.12 serial-0.0.97
  • 22-5-4-貌似只有最新版本的cu113的cuda环境是跟着pytorch一键安装的,使用其他版本的cuda安装下来的都只是cpu版本的,还是需要自己搭建环境

2,wsl使用matplotlib绘图不显示

3,出现CUBLAS_STATUS_INTERNAL_ERROR报错

  • 删除掉nvidia缓存
sudo rm -rf ~/.nv
  • 固定所用的gpu
import torch
torch.cuda.set_device(0)

4,Linux多CUDA版本共存并切换使用

posted @ 2021-11-05 11:12  tensor_zhang  阅读(654)  评论(1编辑  收藏  举报