Failed to initialize NVML: GPU access blocked by the operating system

记录问题:

昨天新到一批GPU (N卡),M40 + M60 + M6 + M4

使用nvidia-smi看不到的 product-name,亦即,那一项显示的内容为ERR!

但是其他的部分内容,例如nivdia-smi -d CLOCK什么的都是可以查看的,

确诊:驱动版本太低;

解决:升级驱动;

在  http://www.nvidia.com/download/driverResults.aspx/97645/en-us 这里下载驱动,注意的是,虽然这里有tesla和geforce的区别,但是

下载下来发现,同一时间节点的驱动,几乎都是一致的,至少我验证了quadro,tesla以及geforce,在2016.1.25这一批的驱动,md5都是相同的;

接下来就是安装咯

 

现在N卡的驱动安装,按照手册中给出的方式一般就轻松搞定了 (LINK 戳),

需要注意的是,在这种傻瓜式的方法当中,注意runlevel的影响;我就是踩到这个坑了:

  1,自己使用terminal远程ssh登录过去,然后基于.run 文件进行安装,一路无异常,但是安装完后,没有nvidia-xconfig的配置跳出,当时也没多注意,

但是之后再使用nvidia-smi以及运行程序的时候,就报出标题错误或者 no available devices

  2,所以,在机器tty下执行: alt+F4 (或者alt+F5,F6也可以),进入tty,在这里的runlevel默认是3,安装驱动一路无话,最后会蹦出xconfig,完成这一

步骤之后,驱动从当前的352.39 升级到了 352.79;tesla M-class的设备都可以正常使用了。。。。

 

posted on 2016-02-03 16:46  馒头山小八路  阅读(3850)  评论(0编辑  收藏  举报

导航