Centos 7 mini版 安装nvidia GPU驱动

1.Centos 7 mini版 

2.准备

yum update

yum install gcc

yum install gcc-c++

yum install kernel-devel

其中需要注意的是,kernel-devel的版本需要与当前内核的版本一致,查看当前内核 uname -r

uname -r
3.10.0-1160.25.1.el7.x86_64
rpm -qa | grep kernel-devel

kernel-devel-3.10.0-1160.25.1.el7.x86_64

3.NVIDIA驱动

根据显卡版本选择相应版本驱动:https://www.nvidia.com/Download/index.aspx?lang=en-us

驱动版本和服务打包相关:目前要求版本是440.x

yum install pciutils

查显卡版本:lspci | grep -i vga

03:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller (rev 04)
65:00.0 VGA compatible controller: NVIDIA Corporation TU102 [TITAN RTX] (rev a1)
b3:00.0 VGA compatible controller: NVIDIA Corporation TU102 [TITAN RTX] (rev a1)

3.1. 禁用nouveau

查看nouveau:lsmod | grep nouveau

nouveau为非N卡官方3D驱动,与驱动不兼容,安装驱动时会提示要禁用,安装程序会引导在/etc/modprobe.d/下没有,就执行如下:

echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

修改dist-blacklist.conf文件:
vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:
#blacklist nvidiafb 

然后添加以下语句:
blacklist nouveau
options nouveau modeset=0

 

然后重新做boot镜像

查内核版本:uname -r

备份镜像:mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

新建镜像:dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启:reboot

重启后可用 lsmod | grep nouveau 检查是否禁用成功,无输出为成功

3.2. 安装驱动

以Linux-x86_64-440.64为例:

chmod 755 NVIDIA-Linux-x86_64-440.64.run

./NVIDIA-Linux-x86_64-440.64.run

如果提示找不到内核源码,加上参数:--kernel-source-path=/usr/src/kernels/$(uname -r)/

安装成功后检查:nvidia-smi

生产环境不用安装以下步骤

4.CUDA和cuDNN

CUDA是NVIDIA开发的一套GPU计算框架,cuDNN是CUDA针对深度神经网络的加速库

Tensorflow版本对应关系:https://tensorflow.google.cn/install/source#gpu

TensorRT对CUDA和cuDNN的要求:https://docs.nvidia.com/deeplearning/sdk/tensorrt-install-guide/index.html

TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.tar.gz

TensorRT-6.0.1.5.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.tar.gz

4.1.CUDA

下载相应版本CUDA 10.0:https://developer.nvidia.com/cuda-toolkit-archive

  sh cuda_10.1.168_418.67_linux.run  --no-opengl-libs

  --no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件,必需参数.

最终用户许可协议-accept

是否安装图形驱动-n     因为前面第3节已经安装了

安装Toolkit-y

Toolkit安装路径-默认

软链接-y

安装示例-n

 

安装完后会有一个warning:

WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 10.0 functionality to work.

因为在是否安装图形驱动时候选择了no,属于正常结果

 

添加环境变量:

export PATH="$PATH:/usr/local/cuda-10.0/bin"
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64"

在/etc/profile.d/下建cuda.sh,写入上述两行就可以进行全局配置

source /etc/profile

检查:nvcc -V

4.2.cuDNN

参考:

下载相应版本cuDNN 7.4:https://developer.nvidia.com/rdp/cudnn-archive (需要注册开发者账号)

解压后将include和lib64下的文件放到4.1cuda安装路径/usr/local/cuda-10.0/下的include和lib64中

 

 

 

 



posted @ 2021-06-07 15:57  向往明天-tsingyun  阅读(586)  评论(0编辑  收藏  举报