centos7安装和卸载GPU v100驱动
显卡驱动的安装并不难,比较麻烦的是驱动版本的选择,而且如果是离线环境的话会有很多依赖包,系统默认安装是不带的。本文不讨论极端环境,现在介绍一下一般情况下的驱动安装方法。
1.查看服务器的显卡版本
lshw -numeric -C display
那我测试的服务器显卡版本是Tesla V100
2.在官方网站选取合适的驱动下载
如图:Priduce Type选择Tesla,Operating system选择linux 64.多选框反应有点慢,选择好后需要等几秒钟。
选择完成,点search在下载给出的驱动版本,也可以复制下载地址直接在服务器上wget
3.准备安装环境
3.1安装依赖
yum install install -y tar bzip2 make automake gcc gcc-c++ pciutils elfutils-libelf-devel libglvnd-devel iptables firewalld vim bind-utils wget
3.2编辑配置文件
vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb
添加以下语句:
blacklist nouveau
options nouveau modeset=0
3.3重建initramfs image文件
cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
重建完成后重启服务器生效,重启这个步骤一定要做。
3.4重启后验证nouveau是否已被禁用
lsmod | grep nouveau
无输出则说明禁用成功。
4.安装驱动
chmod +x NVIDIA-Linux-x86_64-440.118.02.run
./NVIDIA-Linux-x86_64-470.103.01.run
下一步下一步注意报错。
5.验证
nvidia-smi
6.驱动卸载
找到显卡驱动.run文件:
sh NVIDIA-Linux-x86_64-460.106.00-k80.run --uninstall
yum remove nvidia-*
rpm -qa |grep -i nvid|sort
yum remove kmod-nvidia-*