使用nvidia-smi提示(此时X-window也无法正常启动,只能显示输密码界面):
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
用以下命令自动重装驱动:
$ sudo ubuntu-drivers autoinstall
此时可正常使用nvidia-smi,启动gpu docker时又报错。
用以下命令查看驱动情况:
$ nvidia-container-cli -k -d /dev/tty info
也报错。分析发现系统自动安装的driver是430版本(之前好像安装过440或450,重启后不能正常使用)。
因此,用以下命令安装430配套的libcuda1:
$ sudo apt-get install libcuda1-430
安装后docker也可正常使用了。