cuda trigonometry sin cos

¿Hay alguna manera de optimizar llamadas sincos en CUDA?



trigonometry (1)

Una función de sincos bastante rápida y precisa está disponible en la API de CUDA . Solo incluye math.h O use sincosf ( aquí ) si eso funciona para usted. (Soy consciente de que dijiste doble precisión en tu pregunta. Solo estoy señalando algunas cosas).

Si puedes usar sincospif lugar de sincosf , @njuffa ha trabajado su magia aquí , lo que puede interesarte.

Esta pregunta y esta pregunta también pueden interesarte.

Estoy escribiendo un programa en CUDA que realiza una gran cantidad de llamadas a la función sincos() , utilizando doble precisión. Me temo que este es uno de los cuellos de botella más grandes del código, y no puedo reducir el número de llamadas a la función.

¿Hay alguna aproximación decente a los sincos en CUDA o en una biblioteca que puedo importar? También estoy bastante preocupado con la precisión, así que cuanto mejor sea la aproximación, más feliz será mi código.

También he pensado en construir una tabla de búsqueda o aproximar los valores con su serie taylor, pero quiero algunas opiniones antes de seguir por ese camino.