gpu安装
一. 本地挂载iso或yum源
二. 本地安装gpu驱动
1. 安装内核
2. 查看内核版本
ls /boot | grep vmlinu
vmlinuz-4.18.0-305.3.1.el8.x86_64
vmlinuz-4.18.0-305.3.1.el8.x86_64+debug
到nvidia官网下载对应版本:https://www.nvidia.cn/Download/index.aspx?lang=cn
3. 屏蔽默认带有的nouveau
#永久禁用nouveau第三方驱动
cat >> /etc/modprobe.d/blacklist-nouveau.conf << EOF
blacklist nouveau
options nouveau modeset=0
EOF
dracut --force #重新生成 kernel initramfs
reboot #重启
lsmod | grep nouveau #重启后验证驱动是否被禁用 如果无结果显示则表明成功禁用
4. 安装nvidia显卡驱动,输出的警告信息WARNING: nvidia-installer was forced to guess 。。。是正常的,忽略即可
chmod +x NVIDIA-Linux-x86_64-470.57.02.run
./NVIDIA-Linux-x86_64-470.57.02.run # 该条命令不要重复执行
持久化nvidia显卡驱动状态 可解决nvidia-smi命令执行慢
nvidia-persistenced --persistence-mode
5. 验证
# 执行命令
nvidia-smi
如下提示, 表示驱动正常
Wed Dec 29 15:02:39 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.57.02 Driver Version: 470.57.02 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla P4 Off | 00000000:AF:00.0 Off | 0 |
| N/A 31C P8 6W / 75W | 0MiB / 7611MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
三. 本地安装cuda
1. 关闭图形界面管理器
sudo service lightdm stop
2. cuda安装(下面的步骤先看完再做)
此时会进入安装,下面的过程不便截图,描述一下:首先,会询问显示管理器仍有开启,是否继续安装,这里选择continue;然后,会列出一个列表要求选择想要安装的内容,这里将第一个驱动安装的部分回车一下将那个x取消,只安装cuda tool kit即可;之后,方向键选择下面的Install进行安装,最后安装成功后会有一个提示。
这时候cuda是安装好了,但是环境变量找不到cuda程序,自己手动修改环境变量文件,应命令分别为vim ~/.bashrc,将下面的内容添加到文件最后,再通过source ~/.bashrc更新环境变量。
3. 查看安装是否成功
四. 本地安装cudnn
1. 解压cudnn
2. 复制文件和赋权
3. 查看版本是否安装成功
[root@yq01-aip-aikefu09 home]# cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 3
#define CUDNN_PATCHLEVEL 0
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)