Docker配置cuda+pytorch
1 安装Docker
可参考其它安装Docker文章,安装docker;
注意,一定要全部安装完毕,远程也要配置。不然无法通过ssh远程登录。
2 在物理主机安装显卡驱动
驱动对应版本查询官网。
在ubuntu中直接使用命令来查看版本:无需上官网查看,下载。
sudo apt list nvidia-driver*
安装结束之后,重启服务器:sudo reboot
重启结束后查看GPU信息:
nvidia-smi
可以看到显卡驱动已经安装成功,它对应的cuda的型号是11.4版本,那么docker就应当安装不高于此版本。
3.在docker中安装pytorch以及对应的cuda版本
登录dockerhub官网查看镜像,Docker Hub。如下图所示:
这里直接拉取最高的: 1.9.1-cuda11.1-cudnn8-devel镜像,选择devel版本的更方便。
使用docker pull命令下载镜像。
4.镜像下载好之后,启动
使用如下命令:
nvidia-docker run -itd -p 5004:22 pytorch/pytorch:1.9.1-cuda11.1-cudnn8-devel
查询改容器的ID:docker ps
docker run --name <container_name> --gpus all -it <image_name>
登录:
docker exec -it cb52a1489e3a /bin/bash
进入之后,使用命令conda init初始化conda,在重新启动shell工具,登录。
查看cuda版本信息以及pytorch使用显卡信息:
至此,pytorch(gpu)+cuda就可以使用了。但是本地连接服务器上的环境使用更加方便,pycharm和jupyter notebook在本地打开连接服务器都可以。为了图像输出方便,这里选择jupyter notebook。
5.在docker中安装jupyter notebook.
更新环境:apt-get update
安装jupyter:pip install jupyter
使用命令ipython设置密码:
进入/root/.jupyter,打开配置文件,做如下修改
password是上面生成的密码,port是jupyter的端口,这里的端口要和容器中22号对口号映射的5004对应。
配置完毕之后,使用如下命令
conda install ipykernel
安装jupyter中切换环境。
最后,使用如下命令启动Jupyter:
ssh -L localhost:9999:localhost:5004 -p 5004 user_name@ip_address # 远程登录
再输入命令:
jupyter notebook --no-browser --allow-root
启动jupyter。
在本地浏览器中输入localhost:9999,就可以安心科研了。