test instalar how cuda nvcc ptx

instalar - CUDA/PTX de 32 bits frente a 64 bits



nvidia cuda (1)

Los punteros son sin duda la diferencia más obvia . El modelo de máquina de 64 bits permite punteros de 64 bits. Los punteros de 64 bits permiten una variedad de cosas, como espacios de direcciones de más de 4 GB, y direcciones virtuales unificadas . El direccionamiento virtual unificado a su vez permite otras cosas, como GPUDirect Peer-to-Peer . La API CUDA IPC también depende del modelo de máquina de 64 bits.

El ISA x64 no es completamente diferente al ISA x86, es principalmente una extensión del mismo. Quienes estén familiarizados con el ISA x86 encontrarán familiar al x64 ISA, con extensiones naturales para 64 bits cuando sea necesario. Del mismo modo, el modelo de máquina de 64 bits es una extensión de las capacidades del PTX ISA a 64 bits. La mayoría de las instrucciones PTX funcionan exactamente de la misma manera.

El modelo de máquina de 32 bits puede manejar tipos de datos de 64 bits (como el double y long long ), por lo que no es necesario realizar ningún cambio al código fuente CUDA C / C ++ correctamente escrito para compilar para máquina de 32 bits o máquina de 64 bits modelo. Si programa directamente en PTX, es posible que deba tener en cuenta las diferencias de tamaño del puntero , al menos.

Los compiladores CUDA tienen opciones para producir PTX de 32 bits o 64 bits. Cuál es la diferencia entre esto? ¿Es como para x86, las GPU de NVidia en realidad tienen ISA de 32 bits y de 64 bits? ¿O está relacionado solo con el código de host?