Centos 7 mini版安装nvidia GPU驱动

1.Centos 7 mini版

2.准备

yum update

yum install gcc

yum install gcc-c++

yum install kernel-devel

其中需要注意的是，kernel-devel的版本需要与当前内核的版本一致，查看当前内核 uname -r

uname -r
3.10.0-1160.25.1.el7.x86_64
rpm -qa | grep kernel-devel

kernel-devel-3.10.0-1160.25.1.el7.x86_64

3.NVIDIA驱动

根据显卡版本选择相应版本驱动：https://www.nvidia.com/Download/index.aspx?lang=en-us

驱动版本和服务打包相关：目前要求版本是440.x

yum install pciutils

查显卡版本：lspci | grep -i vga

03:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller (rev 04)
65:00.0 VGA compatible controller: NVIDIA Corporation TU102 [TITAN RTX] (rev a1)
b3:00.0 VGA compatible controller: NVIDIA Corporation TU102 [TITAN RTX] (rev a1)

3.1. 禁用nouveau

查看nouveau：lsmod | grep nouveau

nouveau为非N卡官方3D驱动，与驱动不兼容，安装驱动时会提示要禁用，安装程序会引导在/etc/modprobe.d/下没有，就执行如下：

echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

修改dist-blacklist.conf文件：
vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:
#blacklist nvidiafb 

然后添加以下语句：
blacklist nouveau
options nouveau modeset=0

然后重新做boot镜像

查内核版本：uname -r

备份镜像：mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

新建镜像：dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启：reboot

重启后可用 lsmod | grep nouveau 检查是否禁用成功，无输出为成功

3.2. 安装驱动

以Linux-x86_64-440.64为例：

chmod 755 NVIDIA-Linux-x86_64-440.64.run

./NVIDIA-Linux-x86_64-440.64.run

如果提示找不到内核源码，加上参数：--kernel-source-path=/usr/src/kernels/$(uname -r)/

安装成功后检查：nvidia-smi

数据算法 > GPU服务器环境准备 > image2020-10-28_10-16-9.png

生产环境不用安装以下步骤

4.CUDA和cuDNN

CUDA是NVIDIA开发的一套GPU计算框架，cuDNN是CUDA针对深度神经网络的加速库

Tensorflow版本对应关系：https://tensorflow.google.cn/install/source#gpu

数据算法 > GPU服务器环境准备 > image2020-10-28_10-12-12.png

TensorRT对CUDA和cuDNN的要求：https://docs.nvidia.com/deeplearning/sdk/tensorrt-install-guide/index.html

TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.tar.gz

TensorRT-6.0.1.5.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.tar.gz

数据算法 > GPU服务器环境准备 > image2020-10-28_10-14-34.png

4.1.CUDA

下载相应版本CUDA 10.0：https://developer.nvidia.com/cuda-toolkit-archive

　　sh cuda_10.1.168_418.67_linux.run --no-opengl-libs

　　--no-opengl-libs：表示只安装驱动文件，不安装OpenGL文件,必需参数.

最终用户许可协议-accept

是否安装图形驱动-n 因为前面第3节已经安装了

安装Toolkit-y

Toolkit安装路径-默认

软链接-y

安装示例-n

安装完后会有一个warning：

WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 10.0 functionality to work.

因为在是否安装图形驱动时候选择了no，属于正常结果

添加环境变量：

export PATH="$PATH:/usr/local/cuda-10.0/bin"
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64"

在/etc/profile.d/下建cuda.sh，写入上述两行就可以进行全局配置

source /etc/profile

检查：nvcc -V

数据算法 > GPU服务器环境准备 > image2020-10-28_10-17-6.png

4.2.cuDNN

参考：

下载相应版本cuDNN 7.4：https://developer.nvidia.com/rdp/cudnn-archive (需要注册开发者账号)

解压后将include和lib64下的文件放到4.1cuda安装路径/usr/local/cuda-10.0/下的include和lib64中

posted @ 2021-06-07 15:57 向往明天-tsingyun 阅读(586) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

向往明天-清云

Centos 7 mini版安装nvidia GPU驱动

1.Centos 7 mini版

2.准备

3.NVIDIA驱动

3.1. 禁用nouveau

3.2. 安装驱动

4.CUDA和cuDNN

4.1.CUDA

4.2.cuDNN

公告

向往明天-清云

Centos 7 mini版 安装nvidia GPU驱动

1.Centos 7 mini版

2.准备

3.NVIDIA驱动

3.1. 禁用nouveau

3.2. 安装驱动

4.CUDA和cuDNN

4.1.CUDA

4.2.cuDNN

公告

Centos 7 mini版安装nvidia GPU驱动