c++ kinect speech-recognition speech sapi

La biblioteca de reconocimiento de voz más rápida C++



kinect speech-recognition (1)

El problema no es ser rápido, sino una forma adecuada de usar la API. El reconocimiento de voz requiere mucho tiempo, por lo que el truco principal es comenzar a reconocer el audio tan pronto como se grabe , en paralelo con la grabación. Luego, al momento de pronunciar la frase, tendrá casi todos los resultados y podrá reaccionar de inmediato.

El tiempo de respuesta de 0.2 segundos se puede lograr de esta manera, pero necesita una API más flexible para implementar esto. Una buena opción es CMUSphinx , un marco de reconocimiento de voz de código abierto que puede utilizar para su implementación

Sé que es un tema de pregunta general, pero aún quiero saber cuál es la biblioteca de reconocimiento de voz más rápida en C ++.

Actualmente estoy usando Microsoft SAPI con kniect. Funciona bien y reconoce palabras pero es un poco lento, algunas veces toma 1,2 segundos reconocer una palabra y, en mi caso, este retraso está causando muchos problemas de interacción para el usuario.

Revisé la muestra provista con el kinect, en el que la tortuga se mueve a la izquierda a la derecha de acuerdo con las palabras reconocidas, pero incluso eso es un poco lento.

Así que me preguntaba si hay una biblioteca más rápida que sapi, que se puede usar en casos como un robot que usa reconocimiento de voz, dices "izquierda" y luego "derecha", pero el robot sigue moviéndose hacia la izquierda y gira a la derecha después de 1,2 segundos, es un poco frustrante para el usuario.