Ubuntu14.04+CUDA7.5+Docker+Caffe

Ubuntu 14.04.3

CUDA 7.5:cuda-repo-ubuntu1404-7-5-local_7.5-18_amd64.deb

NVIDIA Driver:NVIDIA-Linux-x86_64-361.28.run

Docker Image:kaixhin/cuda-caffe

 

#############################

1.单独安装Nvidia driver 步骤:

  a. 全新安装的Ubuntu14.04.3,下载run文件

  b.sudo gedit /etc/modprobe.d/blacklist.conf

      在末尾输入下面5行字符串:

      blacklist vga16fb

      blacklist nouveau

      blacklist rivafb

      blacklist nvidiafb

      blacklist rivatv

  c. sudo apt-get --purge remove nvidia-*

  d. sudo reboot

  e. ctrl+alt+f1(返回+f7),输入一下命令:

    sudo stop lightdm

    init 3

    cd ./cuda

    sh ..run(run file)(安装过程中全部点yes)

  f. sudo reboot

2. 安装CUDA7.5

  执行上一步a,b,c

  d. dpkg -i ..deb(deb file)

  e. sudo apt-get update(保证软件和更新设置中的“更新”中的“重要安全更新”和“推荐更新”选中)

  f. sudo apt-get install cuda

  g.执行 echo 'export PATH=/usr/local/cuda-7.5/bin:$PATH' >> ~/.bashrc | echo 'export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc  | source ~/.bashrc

  h. sudo reboot

  i.cd /etc/local/cuda-7.5/samples | sudo make

  j. cd /bin/x86_64/linux/release | ./devicequery

 

3. 使用Docker

使用Docker中的Caffe image:kaixhin/cuda-caffe

cuda-caffe中配置了cuda7.5 和 Caffe,使用 docker pull kaixhin/cuda-caffe 命令下载该镜像。但是该景象要求Nvidia Driver版本为352.39,而使用上述步骤安装的CUDA7.5.deb文件中自带的driver为更新的版本,所有导致container中无法使用GPU。

因此需要将此前安装的deb文件卸载,命令为: sudo apt-get --purge autoremove cuda | sudo apt-get --purge remove nvidia-*

到NVIDIA官网下载Cuda_7.5.18_linux.run文件,然后使用1中的方法安装run文件。

然后重启,到/usr/local/cuda-7.5/samples 中进行编译,测试通过即成功。

使用 docker run -it --device /dev/nvidiactl --device /dev/nvidia-uvm --device /dev/nvidia0 kaixhin/cuda-caffe,进入cuda-caffe容器,使用下述命令

$ cd /data/mnist
$ ./get_mnist.sh
$ ./examples/mnist/create_mnist.sh
$ ./examples/mnist/train_lenet.sh
成功运行,测试通过。

 

posted @ 2016-03-06 16:00  DeepCoding  阅读(3666)  评论(1编辑  收藏  举报