centos7安装和卸载GPU v100驱动

显卡驱动的安装并不难,比较麻烦的是驱动版本的选择,而且如果是离线环境的话会有很多依赖包,系统默认安装是不带的。本文不讨论极端环境,现在介绍一下一般情况下的驱动安装方法。
1.查看服务器的显卡版本
lshw -numeric -C display

那我测试的服务器显卡版本是Tesla V100

2.在官方网站选取合适的驱动下载

如图:Priduce Type选择Tesla,Operating system选择linux 64.多选框反应有点慢,选择好后需要等几秒钟。
选择完成,点search在下载给出的驱动版本,也可以复制下载地址直接在服务器上wget

3.准备安装环境

3.1安装依赖
yum install install -y tar bzip2 make automake gcc gcc-c++ pciutils elfutils-libelf-devel libglvnd-devel iptables firewalld vim bind-utils wget

3.2编辑配置文件
vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb
添加以下语句:

blacklist nouveau
options nouveau modeset=0

3.3重建initramfs image文件

cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)

重建完成后重启服务器生效,重启这个步骤一定要做。

3.4重启后验证nouveau是否已被禁用
lsmod | grep nouveau无输出则说明禁用成功。

4.安装驱动
chmod +x NVIDIA-Linux-x86_64-440.118.02.run
./NVIDIA-Linux-x86_64-470.103.01.run
下一步下一步注意报错。

5.验证
nvidia-smi

6.驱动卸载
找到显卡驱动.run文件:
sh NVIDIA-Linux-x86_64-460.106.00-k80.run --uninstall
yum remove nvidia-*
rpm -qa |grep -i nvid|sort
yum remove kmod-nvidia-*

posted @ 2022-02-25 10:38  名字很长容易被惦记  阅读(3330)  评论(0编辑  收藏  举报