centos7安装显卡驱动+CUDA+CUDNN

一、检查机器设备安装的显卡型号

使用nvidia-detect -v命令查看当前机器显卡

Probing for supported NVIDIA devices...
[10de:1b38] NVIDIA Corporation GP102GL [Tesla P40]
This device requires the current 550.54.14 NVIDIA driver kmod-nvidia
[1a03:2000] ASPEED Technology, Inc. ASPEED Graphics Family

注意550.54.14NVIDIA driver ,下载对应版本

如果提示没有nvidia-detect命令,可以使用yum install nvidia-detect进行安装

如果提示没有nvidia-detect包,可以执行yum remove elrepo-release-7.0-6.el7.elrepo.noarch,在执行rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm,解决elrepo-release版本问题,然后使用yum命令进行安装

二、安装前一系列准备工作

更新系统yum -y update

安装yum -y groupinstall "GNOME Desktop" "Development Tools"

yum -y install kernel-devel 

yum -y install epel-release

yum -y install dkms

禁用nouveau

编辑/etc/modprobe.d/blacklist.conf文件加入以下内容

blacklist nouveau

注释掉blacklist nvidiafb(如果存在)

执行lsmod | grep nouveau

如果没有输出,则禁用成功

不成功执行下面方法:

vim /lib/modprobe.d/dist-blacklist.conf

#blacklist nvidiafb

blacklist nouveau
options nouveau modeset=0

sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)rreboot

升级gcc

安装sudo yum install centos-release-scl

sudo yum install devtoolset-9-gcc*

scl enable  devtoolset-9 bash

三、安装显卡驱动

将下载好的包(NVIDIA-Linux-x86_64-440.95.01.run)上传到机器

执行chmod a+x NVIDIA-Linux-x86_64-440.95.01.run

./NVIDIA-Linux-x86_64-440.95.01.run

  选择No继续,

 报错了,需要执行./NVIDIA-Linux-x86_64-440.95.01.run --kernel-source-path=/usr/src/kernels/3.10.0-1160.108.1.el7.x86_64 -k $(uname -r)

这个kernel-source-path路径具体看自己机器的进行修改,然后选NO继续就开始安装了

 

 选择No继续

 选择Install and overwrite existing files继续完成安装

如果在安装过程中报错ERROR: Unable to load the 'nvidia-drm' kernel module

一般是在系统update后没有重启,原来的kernel-devel版本和新装的版本不一致导致的

例如:

存在两个版本,需要删除旧的rpm -e 3.10.0-957.el7.x86_64(我在操作中因为是yum  install update -y直接更新的,所以旧版本因为没重启才存在,重启机器后,不在存在冲突问题)

执行nvidia-smi检查安装是否成功

 四、CUDA安装

根据nvidia-smi命令,我们确认需要安装CUDA10.2版本

 

下载对应版本

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod//local_installers/cuda_10.2.89_440.33.01_linux.run

 将下载的cuda_10.2.89_440.33.01_linux.run文件上传到机器

使用root用户执行chmod +x cuda_10.2.89_440.33.01_linux.run # 下载的CUDA 文件
运行sh cuda_10.2.89_440.33.01_linux.run

# 按着提示来装
Do you accept the previously read EULA?
accept/decline/quit: accept

 

 因为已经安装了驱动,所以把驱动勾掉,选install

 因为之前装了CUDA10,所以选择更新

 

安装完以后要修改环境变量,如下:

vim /etc/profile,添加如下内容

 执行source /etc/profile

执行nvcc -v检查安装版本

  五、CUDNN安装

下载CUDNN:https://developer.download.nvidia.cn/compute/cudnn/redist/cudnn/linux-x86_64/

cudnn-linux-x86_64-8.4.0.27_cuda10.2-archive.tar.xz

上传解压

tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda10.2-archive.tar.xz

进入cudnn-linux-x86_64-8.4.0.27_cuda10.2-archive目录

执行

cp include/cudnn*.h /usr/local/cuda-10.2/include/

cp lib/libcudnn* /usr/local/cuda-10.2/lib64/

chmod a+r /usr/local/cuda-10.2/include/cudnn*.h

chmod a+r /usr/local/cuda-10.2/lib64/libcudnn*

cudnn 8版本以上的使用下面命令验证
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

 

本文作者:运维dog

本文链接:https://www.cnblogs.com/sheepships/p/18072617

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   运维dog  阅读(2883)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起
  1. 1 彩虹 Jay
彩虹 - Jay
00:00 / 00:00
An audio error has occurred.

彩虹 + 轨迹 (Live) - 周杰伦 (Jay Chou)

彩虹

词:周杰伦

曲:周杰伦

哪里有彩虹告诉我

哪里有彩虹告诉我

能不能把我的愿望还给我

能不能把我的愿望还给我

为什么天这么安静

为什么天这么安静

所有的云都跑到我这里

有没有口罩一个给我

有没有口罩一个给我

释怀说了太多就成真不了

释怀说了太多就成真不了

也许时间是一种解药

也许时间是一种解药

也是我现在正服下的毒药

也是我现在正服下的毒药

看不见你的笑 我怎么睡得着

看不见你的笑 我怎么睡得着

你的声音这么近我却抱不到

你的声音这么近我却抱不到

没有地球太阳还是会绕

没有地球太阳还是会绕

没有理由我也能自己走

没有理由我也能自己走

你要离开 我知道很简单

你要离开 我知道很简单

你说依赖 是我们的阻碍

你说依赖 是我们的阻碍

就算放开 但能不能别没收我的爱

就算放开 但能不能别没收我的爱

当作我最后才明白

当作我最后才明白

看不见你的笑 要我怎么睡得着

看不见你的笑 要我怎么睡得着

你的声音这么近我却抱不到

没有地球太阳还是会绕 会绕

没有理由我也能自己走掉

释怀说了太多就成真不了

也许时间是一种解药 解药

也是我现在正服下的毒药

轨迹

词:黄俊郎

曲:周杰伦

我会发着呆然后忘记你

接着紧紧闭上眼

想着哪一天 会有人代替

想着哪一天 会有人代替

让我不再想念你

我会发着呆 然后微微笑

我会发着呆 然后微微笑

接着紧紧闭上眼

又想了一遍 你温柔的脸

又想了一遍 你温柔的脸

在我忘记之前