ubuntu16.04 安装NVIDIA和CUDA9.2 cudNN7.1

1.安装NVIDIA驱动

重复登录的问题是因为NVIDIA驱动版本和linux内核版本不匹配导致的，因为linux内核一直在更新，更新后可能不匹配。

所以安装系统后选择不更新，也有命令，可以更新内核版本使得nvidia匹配。

（1）查询NVIDIA驱动

首先去官网(http://www.nvidia.com/Download/index.aspx?lang=en-us)查看适合自己显卡的驱动（下载runfile文件）：

2）安装驱动

先按Ctrl + Alt + F1到控制台，关闭当前图形环境

　　$sudo service lightdm stop

卸载可能存在的旧版本 nvidia 驱动

sudo apt-get remove --purge nvidia*

安装驱动可能需要的依赖

 $sudo apt-get update

 $sudo apt-get install dkms build-essential linux-headers-generic

把 nouveau 驱动加入黑名单并禁用用 nouveau 内核模块（如果新重装的系统，没有驱动起作用，忽略）

sudo nano /etc/modprobe.d/blacklist-nouveau.conf
 在文件 blacklist-nouveau.conf 中加入如下内容：
blacklist nouveau
options nouveau modeset=0
保存退出，执行
 sudo update-initramfs -u

ctrl+O保存。然后回车 ctrl+X 退出
reboot重启


若/boot空间不足

uname -a 查看目前在用的内核版本
dpkg --get-selections|grep linux-image 显示所有的内核版本
sudo apt remove linux-image-XXXX-generic 卸载旧内核，注意只保留最新的 两个 版本
sudo apt autoremove 清理无用的依赖

运行驱动安装文件

重启后再次进入字符终端界面（Ctrl + Alt + F1），并关闭图形界面

  $sudo service lightdm stop

安装驱动

  $sudo chmod u+x NVIDIA-Linux-x86_64-361.45.11.run

  $sudo ./NVIDIA-Linux-x86_64-361.45.11.run（sudo ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files）
或 sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files

kenel 不装选NO； X-config Yes

最后重新启动图形环境

$sudo service lightdm start

可以通过以下命令确认驱动是否正确安装

$cat /proc/driver/nvidia/version

2.安装cuda8.0

9.0的时候用runfile没有安装成功，用安装包装的，ok了。安装包本地：

`sudo dpkg -i cuda-repo-ubuntu1604-9-2-local_9.2.88-1_amd64.deb`
`sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub`
`sudo apt-get update`
`sudo apt-get install cuda`

可能出现 Driver/library version mismatch 的问题，重启，或者按照此方法。

需要进入安全模式安装（lightdm），在安装cuda时是可以自动安装NVIDIA驱动的，但是这样安装的驱动版本较低，且可能有问题，所以需要先安装NVIDIA驱动，在安装CUDA时选择不安装驱动。

切换到cuda_8.0.44_linux.run的目录，执行

$ sudo sh cuda_8.0.44_linux.run

!Note:安装的时候，要让你先看一堆文字（EULA)，我们直接不停的按空格键到100%，或者Ctrl+C跳过;
遇到提示是否安装nvidia ，选择no,其他的可以一路accept, yes或回车，可以选择安装Sample，用以验证。

登录时能进入桌面，不会一直在重复登录，成功已近大半。曾经遇到过这样的情况，不过后来重装了系统，没有禁OpenGL也可以，这个有一定概率。

!Note:如果出现重复登陆情况，请卸载cuda,然后重装。
原因：是OpenGL与NVIDIA发生了什么什么的。
卸载：由于登陆进入不到图形用户界面（GUI），但我们可以进入到文本用户界面(TUI)(TUI很酷有没有?)

在登陆界面时，按Ctrl + Alt + f1,进入TUI
一定要按照这种方式卸载，不然装不上去
执行
$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
$ sudo /usr/bin/nvidia-uninstall
然后重启
$ sudo reboot
重新安装.run(安装时请留眼，在提示是否安装OpenGL时，应该选no)

据说这是防止重复登录的方法：问题解决：进入bios之后，关闭secure boot即可。（也有资料说需要关fast boot的，但是笔者懒得关了，也没问题） 
具体地，惠普的台式机，进入bios之后是中文的，造成了一定的阅读障碍。在安全里面，然后有个安全启动相关的菜单。进去之后立刻有一个全红的警示页面，也只是警示，看懂了进去就可以了。

配置环境，在主文件夹中打开.bashrc:

gedit ./.bashrc

末尾加入一下路径，保存关闭

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
 export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\
 ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

安装运行实例程序的相关依赖项：

$ sudo apt-get install g++ freeglut3-dev build-essential libx11-dev \
 libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

运行样例程序

$ cd ~/NVIDIA_CUDA-8.0_Samples/5_Simulations/nbody
$ make
$ ./nbody

如果没有装opengl 那个这个nbody运行不了，可以运行第一个，用nvcc -V来查看是否装好了。

安装完毕，可以愉快的使用了。

安装CudNN

下在对应的版本（cudnn-9.2-linux-x64-v7.1）按照官网教程，解压复制：

$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz

$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*

posted @ 2017-10-17 10:57 奔跑_少年阅读(25601) 评论(0) 收藏举报

刷新页面返回顶部

ubuntu16.04 安装NVIDIA和CUDA9.2 cudNN7.1

（1）查询NVIDIA驱动

2）安装驱动

运行驱动安装文件

公告