webkitspeechrecognition responsivevoice example ejemplos javascript html5 google-chrome speech-recognition speech-to-text

responsivevoice - JavaScript Speech-to-Text para personas ciegas



web speech api ejemplos (2)

¿Es posible usar x-webkit-speech presionando una tecla?

De acuerdo con esta post y esta post no puede anular el inicio de la conversación haciendo clic en el micrófono.

Lo que está haciendo el x-webkit-speech es utilizar las capacidades de captura de audio de HTML5 y enviar el audio a los servidores de Google para su procesamiento, devolviendo los resultados en JSON. Este blogger lo ha revertido . Podría desarrollar una biblioteca de JavaScript que busque una pulsación de tecla para comenzar a capturar audio en navegadores habilitados para HTML5 y enviarlo al servicio de Google o a uno que haya creado. La desventaja de usar el servicio de Google es que es una API no compatible y está sujeta a cambios en cualquier momento. La desventaja de desarrollar su propio servicio es que puede ser costoso desarrollarlo y mantenerlo.

¿Conoces alguna API alternativa (JavaScript)?

Esta post y esta post enumeran algunos servicios disponibles para el reconocimiento de voz. No vi a Nuance en la lista. Es posible que pueda utilizar el SDK de Dragon Mobile para esto. Y es posible que desee registrarse en ISpeech .

Estoy desarrollando un sitio web, y me gustaría ayudar a las personas ciegas a usarlo por la voz, así que usaré:

  • Texto a voz, para dar algunas posibilidades al usuario.
  • Voz a texto, para permitir que el usuario use su voz para seleccionar una

Ya tengo algunas bibliotecas de JavaScript de texto a voz (como speak.js ), pero ahora necesito una buena de voz a texto. Existen algunas soluciones para este propósito (como speechapi ), pero usan Java Applets o Flash, y quiero depender solo de JavaScript para evitar los complementos.

Estoy probando la entrada de voz de HTML5 con x-webkit-speech y Google Chrome, y es bueno, pero necesitas hacer clic sobre un icono (y las personas ciegas no pueden usar bien el mouse). ¿Es posible usar x-webkit-speech presionando una tecla? ¿Conoces alguna API alternativa (JavaScript)?

¡Gracias!


Google Translate es muy bueno Text To Speech Engine. Solía ​​leer un texto con él. Por ejemplo, tienes un texto: welcome to , puedes llamar así.

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

luego usa el audio del navegador para reproducirlo

Para la entrada de voz, puede activar manualmente el proceso de escucha, consulte aquí http://code.google.com/chrome/extensions/experimental.speechInput.html