google api - test - API de reconocimiento de voz de Google
google speech to text api python (5)
Este es un post antiguo, pero espero que ayude a alguien. No pude encontrar la API de Speech incluida en las API populares en https://console.developers.google.com/ tampoco. Debe buscar la API de voz mediante el campo de búsqueda "Buscar en todas las 100 APIs".
Estoy tratando de usar Google Speech API v2 (en la dirección https://www.google.com/speech-api/v2/recognize?...
)
Necesito usar mi clave Api, pero cuando la uso obtengo el error 403 Forbidden
Cuando uso una clave de API que estaba en el proyecto de ejemplo que descargué, está funcionando bien.
Vi que en la Consola de desarrolladores de Google puedo habilitar muchas opciones de API, pero no encontré ninguna opción de Speech-API. ¿Debo habilitar algo más para obtener acceso a esta API con mi clave?
¡Gracias!
Las instrucciones están aquí: http://www.chromium.org/developers/how-tos/api-keys
!! ¡No olvide activar la API "Speech API" en "APIs" en "APIS & AUTH"!
No estoy seguro de que esta API esté disponible para todos, pero aquí hay un proyecto github que proporciona una clave válida. Debes probar con esta llave.
Para utilizar el servicio necesitas:
- obtener una clave de desarrollador (ver las respuestas anteriores para obtener instrucciones)
- envíe un archivo de audio mono flac a http://www.google.com/speech-api/v2/recognize (Google ya no acepta audio estéreo)
- especifique la frecuencia de muestreo de su archivo de audio (por ejemplo,
16000
,44100
, etc.) y Content-Type comoaudio/x-flac
en su encabezado HTTP - Especifique valores para
key
parámetroskey
,client
ylang
en la url
Aquí hay un ejemplo de wget
con parámetros completos y encabezado:
wget -q --post-file file.flac --header="Content-Type: audio/x-flac; rate=16000" -O - "http://www.google.com/speech-api/v2/recognize?client=chromium&lang=en_US&key=AIzaSyAcalCzUvPmmJ7CZBFOEWx2Z1ZSn4Vs1gg"
Tenga en cuenta que el servicio gratuito está limitado a 50 solicitudes por día para una clave de desarrollador.
Este repositorio ofrece un script de shell para usar la API desde la línea de comandos (incluida la grabación de voz).
Según http://www.chromium.org/developers/how-tos/api-keys ya no existe una cuota para las API de voz a texto de Google. Por lo tanto, no la encontrarás en la consola de proyectos de Google Cloud.