Docker配置cuda+pytorch

 

1 安装Docker

可参考其它安装Docker文章,安装docker

注意,一定要全部安装完毕,远程也要配置。不然无法通过ssh远程登录。

 

2 在物理主机安装显卡驱动

驱动对应版本查询官网。

 

 

ubuntu中直接使用命令来查看版本:无需上官网查看,下载。

sudo apt list nvidia-driver*

 

安装结束之后,重启服务器:sudo reboot

重启结束后查看GPU信息:

nvidia-smi

可以看到显卡驱动已经安装成功,它对应的cuda的型号是11.4版本,那么docker就应当安装不高于此版本。

3.在docker中安装pytorch以及对应的cuda版本

登录dockerhub官网查看镜像,Docker Hub。如下图所示:

这里直接拉取最高的: 1.9.1-cuda11.1-cudnn8-devel镜像,选择devel版本的更方便。

使用docker pull命令下载镜像。

4.镜像下载好之后,启动

使用如下命令:

nvidia-docker run -itd -p 5004:22 pytorch/pytorch:1.9.1-cuda11.1-cudnn8-devel

查询改容器的ID:docker ps

 启动容器,如果无法识别gpu驱动,尝试使用
docker run --name <container_name> --gpus all -it <image_name>

 

登录:

docker exec -it cb52a1489e3a /bin/bash

进入之后,使用命令conda init初始化conda,在重新启动shell工具,登录。

查看cuda版本信息以及pytorch使用显卡信息:

至此,pytorch(gpu)+cuda就可以使用了。但是本地连接服务器上的环境使用更加方便,pycharm和jupyter notebook在本地打开连接服务器都可以。为了图像输出方便,这里选择jupyter notebook。

5.在docker中安装jupyter notebook.

更新环境:apt-get update

安装jupyter:pip install jupyter

使用命令ipython设置密码:

 

 

进入/root/.jupyter,打开配置文件,做如下修改

 

 

 

password是上面生成的密码,port是jupyter的端口,这里的端口要和容器中22号对口号映射的5004对应。

配置完毕之后,使用如下命令

conda install ipykernel

安装jupyter中切换环境。

最后,使用如下命令启动Jupyter:

ssh -L localhost:9999:localhost:5004 -p 5004 user_name@ip_address # 远程登录

再输入命令:

jupyter notebook --no-browser --allow-root

启动jupyter。

在本地浏览器中输入localhost:9999,就可以安心科研了。

 

posted @ 2022-06-07 18:08  IllidanStormrage  阅读(3271)  评论(0编辑  收藏  举报