javascript - tutorial - ¿Existe una API para la tecnología de reconocimiento de voz de Google?

google speech api tutorial (4)

Quiero intentar crear una presentación de diapositivas jQuery utilizando comandos de voz simples como "siguiente" o "anterior". ¿Hay alguna forma de utilizar el reconocimiento de voz de Google? Sé sobre x-webkit-speech de Chrome, pero tengo que hacer clic en un botón para usarlo.

Probé el WAMI de MIT, pero lo encontré más lento y menos preciso que el conocimiento del habla de Google.

A partir de hoy esto ya existe, para Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html

( api doc )

El problema es qué capturará la voz de su usuario y le enviará algún servidor de voz para su procesamiento. x-webkit-speech está integrado en el navegador y el navegador utiliza la tarjeta de sonido de la PC para capturar la voz. Javascript / Jquery en un solo navegador no puede acceder a los dispositivos de hardware. No sé si Chrome expone algún objeto x-webkit-speech en el DOM para que pueda capturar a través de Javascript.

Dicho esto, la gente ha creado ingeniería inversa de la API de voz de Google y la ha utilizado desde el código. Consulte http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ para ver un ejemplo.

Encontré esto, no lo he usado personalmente, no sé si es lo que está buscando, pero eche un vistazo.

http://captico.com/introducing-speech-2-text-api-by-google/2011/03

Para una manera fácil de hacer esto con JavaScript, echa un vistazo a talater.com/annyang , que es una biblioteca que hace que manejar el reconocimiento de voz sea muy fácil.