ultima mac cnn cuda nvidia

mac - Bloques máximos por cuadrícula: CUDA



cuda wikipedia (2)

65535 por dimensión de la cuadrícula. En las tarjetas de cálculo 1.x, se admiten las cuadrículas 1D y 2D. En las tarjetas de computación 2.x, también se admiten las cuadrículas 3D, por lo que 65535, 65535 x 65535 y 65535 x 65535 x 65535 son los límites para las tarjetas Fermi (computar 2.x).

¿Cuál es el número máximo de bloques en una cuadrícula que se puede crear por lanzamiento del kernel? Estoy un poco confundido aquí desde

Ahora, la tabla de capacidades de cálculo here dice que puede haber 65535 bloques por dimensión de cuadrícula en la capacidad de cálculo 2.0 de CUDA.

¿Eso significa que el número total de bloques = 65535 * 65535?

¿O significa que puede reorganizar como máximo 65535 en una cuadrícula 1d de 65536 bloques o una cuadrícula 2d de sqrt (65535) * sqrt (65535)?

Gracias.


Creo que es 65535 por cuadrícula ...