gpu安装

 
 

一. 本地挂载iso或yum源

二. 本地安装gpu驱动

1. 安装内核

 

2. 查看内核版本

 
Plain Text
收起
ls /boot | grep vmlinu
vmlinuz-4.18.0-305.3.1.el8.x86_64
vmlinuz-4.18.0-305.3.1.el8.x86_64+debug

到nvidia官网下载对应版本:https://www.nvidia.cn/Download/index.aspx?lang=cn

3. 屏蔽默认带有的nouveau

 
Plain Text
收起
#永久禁用nouveau第三方驱动
cat >> /etc/modprobe.d/blacklist-nouveau.conf << EOF
blacklist nouveau
options nouveau modeset=0
EOF
dracut --force #重新生成 kernel initramfs
reboot #重启
lsmod | grep nouveau #重启后验证驱动是否被禁用 如果无结果显示则表明成功禁用

4. 安装nvidia显卡驱动,输出的警告信息WARNING: nvidia-installer was forced to guess 。。。是正常的,忽略即可

 
Plain Text
收起
chmod +x NVIDIA-Linux-x86_64-470.57.02.run
./NVIDIA-Linux-x86_64-470.57.02.run # 该条命令不要重复执行

持久化nvidia显卡驱动状态 可解决nvidia-smi命令执行慢

 
Plain Text
收起
nvidia-persistenced --persistence-mode

5. 验证

# 执行命令

 
Plain Text
收起
nvidia-smi
如下提示, 表示驱动正常
Wed Dec 29 15:02:39 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.57.02    Driver Version: 470.57.02    CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P4            Off  | 00000000:AF:00.0 Off |                    0 |
| N/A   31C    P8     6W /  75W |      0MiB /  7611MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

三. 本地安装cuda

1. 关闭图形界面管理器

 
Plain Text
收起
sudo service lightdm stop

2. cuda安装(下面的步骤先看完再做)

 

此时会进入安装,下面的过程不便截图,描述一下:首先,会询问显示管理器仍有开启,是否继续安装,这里选择continue;然后,会列出一个列表要求选择想要安装的内容,这里将第一个驱动安装的部分回车一下将那个x取消,只安装cuda tool kit即可;之后,方向键选择下面的Install进行安装,最后安装成功后会有一个提示。

这时候cuda是安装好了,但是环境变量找不到cuda程序,自己手动修改环境变量文件,应命令分别为vim ~/.bashrc,将下面的内容添加到文件最后,再通过source ~/.bashrc更新环境变量。

 

3. 查看安装是否成功

 

四. 本地安装cudnn

1. 解压cudnn

 

2. 复制文件和赋权

 

3. 查看版本是否安装成功

 
Plain Text
收起
[root@yq01-aip-aikefu09 home]# cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 
#define CUDNN_MAJOR 8
#define CUDNN_MINOR 3
#define CUDNN_PATCHLEVEL 0
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
posted @ 2022-05-10 10:32  CF211  阅读(403)  评论(0编辑  收藏  举报