responsivevoice - JavaScript Speech-to-Text para personas ciegas
web speech api ejemplos (2)
¿Es posible usar x-webkit-speech presionando una tecla?
De acuerdo con esta post y esta post no puede anular el inicio de la conversación haciendo clic en el micrófono.
Lo que está haciendo el x-webkit-speech es utilizar las capacidades de captura de audio de HTML5 y enviar el audio a los servidores de Google para su procesamiento, devolviendo los resultados en JSON. Este blogger lo ha revertido . Podría desarrollar una biblioteca de JavaScript que busque una pulsación de tecla para comenzar a capturar audio en navegadores habilitados para HTML5 y enviarlo al servicio de Google o a uno que haya creado. La desventaja de usar el servicio de Google es que es una API no compatible y está sujeta a cambios en cualquier momento. La desventaja de desarrollar su propio servicio es que puede ser costoso desarrollarlo y mantenerlo.
¿Conoces alguna API alternativa (JavaScript)?
Esta post y esta post enumeran algunos servicios disponibles para el reconocimiento de voz. No vi a Nuance en la lista. Es posible que pueda utilizar el SDK de Dragon Mobile para esto. Y es posible que desee registrarse en ISpeech .
Estoy desarrollando un sitio web, y me gustaría ayudar a las personas ciegas a usarlo por la voz, así que usaré:
- Texto a voz, para dar algunas posibilidades al usuario.
- Voz a texto, para permitir que el usuario use su voz para seleccionar una
Ya tengo algunas bibliotecas de JavaScript de texto a voz (como speak.js ), pero ahora necesito una buena de voz a texto. Existen algunas soluciones para este propósito (como speechapi ), pero usan Java Applets o Flash, y quiero depender solo de JavaScript para evitar los complementos.
Estoy probando la entrada de voz de HTML5 con x-webkit-speech y Google Chrome, y es bueno, pero necesitas hacer clic sobre un icono (y las personas ciegas no pueden usar bien el mouse). ¿Es posible usar x-webkit-speech presionando una tecla? ¿Conoces alguna API alternativa (JavaScript)?
¡Gracias!
Google Translate es muy bueno Text To Speech Engine. Solía leer un texto con él. Por ejemplo, tienes un texto: welcome to
, puedes llamar así.
http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input
luego usa el audio del navegador para reproducirlo
Para la entrada de voz, puede activar manualmente el proceso de escucha, consulte aquí http://code.google.com/chrome/extensions/experimental.speechInput.html