电脑突然断电,开机后发现cuda不可用,于是输入“nvidia-smi”才发现了一个错误,如下
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver
由于重启服务器,linux内核升级导致的,由于linux内核升级,之前的Nvidia驱动就不匹配连接了,但是此时Nvidia驱动还在,可以通过命令 nvcc -V
找到答案。
解决方法
-
安装dkms:
sudo apt-get install dkms
-
查看本机连接不上的驱动版本:
ls -l /usr/src/
可以看到有一个nvidia的文件,我这里是 nvidia-xxx.xxx.xx
-
使用dkms重新安装适合驱动:
sudo dkms install -m nvidia -v xxx.xx.xx
xxx.xxx.xx是第二步中出现的版本
最后一次更新于2022-09-11
0 条评论