tutorial que quadro m1000m cuda definition

que - quadro m1000m cuda



¿Qué significa "capacidad de cálculo" significa wrt CUDA? (2)

Soy nuevo en la programación de CUDA y no sé mucho al respecto. ¿Puede decirme por favor qué significa ''capacidad de cálculo CUDA''? Cuando uso el siguiente código en mi servidor de la universidad, me mostró el siguiente resultado.

for (device = 0; device < deviceCount; ++device) { cudaDeviceProp deviceProp; cudaGetDeviceProperties(&deviceProp, device); printf("/nDevice %d has compute capability %d.%d./n", device, deviceProp.major, deviceProp.minor); }

RESULTADO:

Device 0 has compute capability 4199672.0. Device 1 has compute capability 4199672.0. Device 2 has compute capability 4199672.0. . .

cudaGetDeviceProperties devuelve dos campos principales y menores. ¿Puedes decirme qué es esto 4199672.0. ¿medio?


La capacidad de cálculo es el "conjunto de características" (características de hardware y software) del dispositivo. Es posible que haya escuchado la arquitectura NVIDIA GPU nombres "Tesla", "Fermi" o "Kepler". Cada una de esas arquitecturas tiene características que las versiones anteriores podrían no tener.

En la carpeta de instalación de su kit de herramientas CUDA en su disco duro, busque el archivo CUDA_C_Programming_Guide.pdf (o google it), y encuentre el Apéndice F.1 . Describe las diferencias en las características entre las diferentes capacidades de cálculo.


Como se menciona en @dialer, la capacidad de cálculo es el conjunto de características relacionadas con el cálculo de su dispositivo CUDA. A medida que se desarrolla la API CUDA de NVidia, aumenta el número de "capacidad de cálculo". En el momento de escribir, las nuevas GPU de NVidia son Compute Capability 3.5. Puede obtener algunos detalles de lo que significan las diferencias al examinar esta tabla en Wikipedia.

Como @aland sugiere, su llamada probablemente falló, y lo que obtiene es el resultado de usar una variable no inicializada . Debería envolver su llamada a cudaGetDeviceProps() con una función de comprobación de errores o macro llamada; ver

¿Cuál es la forma canónica de verificar errores utilizando la API de tiempo de ejecución de CUDA?

para una discusión de la mejor manera de hacer esto.