linux ubuntu cuda nvidia caffe

linux - caffe install ubuntu 18



No se pudo insertar ''nvidia_352'': No hay tal dispositivo (3)

Ahora el problema esta resuelto. Revisé sudo dpkg --list | grep nvidia sudo dpkg --list | grep nvidia Encontré como mi núcleo tiene 352.41, pero el cliente tiene 304.12. Así que hice sudo apt-get remove --purge nvidia-* . Eliminó todos los paquetes. Luego, instale 352.41 como

$ sudo add-apt-repository ppa:xorg-edgers/ppa -y $ sudo apt-get update $ sudo apt-get install nvidia-352

Después de esto

$ sudo dpkg --list | grep nvidia rc nvidia-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA legacy binary driver - version 304.128 rc nvidia-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA legacy binary driver - version 304.125 ii nvidia-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA binary driver - version 352.41 rc nvidia-opencl-icd-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA OpenCL ICD rc nvidia-opencl-icd-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA OpenCL ICD ii nvidia-opencl-icd-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA OpenCL ICD ii nvidia-prime 0.6.2 amd64 Tools to enable NVIDIA''s Prime ii nvidia-settings 355.11-0ubuntu0~gpu14.04.1 amd64 Tool for configuring the NVIDIA graphics driver

Ahora la versión coincide. Luego ./deviceQuery y todo funciona como se espera. Gracias

Estoy tratando de ejecutar caffe en Linux Ubuntu . Después de la instalación, ejecuto caffe en gpu y el error es

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 modprobe: ERROR: could not insert ''nvidia_352'': No such device F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected *** Check failure stack trace: *** @ 0x7ffd3b9a7daa (unknown) @ 0x7ffd3b9a7ce4 (unknown) @ 0x7ffd3b9a76e6 (unknown) @ 0x7ffd3b9aa687 (unknown) @ 0x7ffd3bf91cb5 caffe::Caffe::SetDevice() @ 0x40a5a7 time() @ 0x4080f8 main @ 0x7ffd3aeb9ec5 (unknown) @ 0x408618 (unknown) @ (nil) (unknown) Aborted (core dumped)

Mi controlador NVIDIA es 352.41. Instalé 352 y está instalada la última versión.

sudo apt-get install nvidia-352[sudo] Reading package lists... Done Building dependency tree Reading state information... Done nvidia-352 is already the newest version. The following packages were automatically installed and are no longer required: account-plugin-windows-live libupstart1 Use ''apt-get autoremove'' to remove them. 0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded.

Mi Ubuntu tiene un controlador NVIDIA 352 y por qué tengo un error como

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 modprobe: ERROR: could not insert ''nvidia_352'': No such device F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected

Comprobé si tengo un dispositivo capaz de CUDA como

lspci | grep -i nvidia 05:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K2000] (rev a1) 05:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1)

Tengo un dispositivo compatible con CUDA y ¿por qué me sale el error?

EDIT 1: Sí, mi prueba con ./deviceQuery falló.

../NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release/deviceQuery Starting... CUDA Device Query (Runtime API) version (CUDART static linking) cudaGetDeviceCount returned 38 -> no CUDA-capable device is detected Result = FAIL

Revisé en la carpeta dev /, tengo nvidia0.

crwxrwxrwx 1 root root 195, 0 Sep 10 16:51 nvidia0 crw-rw-rw- 1 root root 195, 255 Sep 10 16:51 nvidiactl

Mi nvcc -V cheque me dio

li@li-HP-Z420-Workstation:/dev$ nvcc -V nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2015 NVIDIA Corporation Built on Tue_Aug_11_14:27:32_CDT_2015 Cuda compilation tools, release 7.5, V7.5.17

Entonces mi verificación de versión

li@li-HP-Z420-Workstation:/dev$ cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 352.41 Fri Aug 21 23:09:52 PDT 2015 GCC version: gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04)

¿Qué podría estar mal?


Yo también tuve este problema. Las respuestas anteriores no funcionaron para mí. Cuando instalé el último controlador ( nvidia-364 ), funcionó. Comandos para ejecutar:

sudo add-apt-repository ppa:xorg-edgers/ppa sudo apt-get update sudo apt-get install nvidia-364

Creo que el problema ocurre cuando tenemos una versión diferente de gcc utilizada para compilar los módulos de controlador y el kernel de Linux.


Tengo este problema también. Y la reinstalación de los controladores de nvidia no resolvió el problema.

Finalmente, resolví este problema agregando dos parámetros de kernel con grub.

añadir:

GRUB_CMDLINE_LINUX_DEFAULT

con:

pci=nocrs pci=realloc

Creo que esto es una colisión entre cuda7.5 y kernel3.19 .