voz usar texto reconocimiento recognition español ejemplos como artyom annyang html5 google-chrome speech-recognition voice voice-recognition

html5 - usar - voz a texto java



¿Qué son los códigos de idioma en la implementación de Chrome de la API de reconocimiento de voz HTML5? (4)

Chrome implementó la API de reconocimiento de voz HTML5. Muchos idiomas son compatibles. Quiero saber qué idiomas son compatibles y el código correspondiente a cada idioma que se utiliza en el atributo lang del elemento HTML.

Por ejemplo:

  • Polaco (pl-PL)
  • Turco (tr-TR)

¡Gracias!


Aquí tienes @TimHayes en un LinkedHashMap donde puedes obtener los valores. Estoy usando LinkedHashMap para obtener la posición del mapa.

LinkedHashMap<String,String> country = new LinkedHashMap<String,String>(); country.put("South Africa", "af-ZA"); country.put("Algeria", "ar-DZ"); country.put("Bahrain", "ar-BH"); country.put("Egypt", "ar-EG"); country.put("Israel", "ar-IL"); country.put("Iraq", "ar-IQ"); country.put("Jordan", "ar-JO"); country.put("Kuwait", "ar-KW"); country.put("Lebanon", "ar-LB"); country.put("Morocco", "ar-MA"); country.put("Oman", "ar-OM"); country.put("Palestinian Territory", "ar-PS"); country.put("Qatar", "ar-QA"); country.put("Saudi Arabia", "ar-SA"); country.put("Tunisia", "ar-TN"); country.put("UAE", "ar-AE"); country.put("Spain", "eu-ES"); country.put("Bulgaria", "bg-BG"); country.put("Spain", "ca-ES"); country.put("China (Simp.)", "cmn-Hans-CN"); country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK"); country.put("Taiwan (Trad.)", "cmn-Hant-TW"); country.put("Hong Kong", "yue-Hant-HK"); country.put("Croatia", "hr_HR"); country.put("Czech Republic", "cs-CZ"); country.put("Denmark", "da-DK"); country.put("Australia", "en-AU"); country.put("Canada", "en-CA"); country.put("India", "en-IN"); country.put("Ireland", "en-IE"); country.put("New Zealand", "en-NZ"); country.put("Philippines", "en-PH"); country.put("South Africa", "en-ZA"); country.put("United Kingdom", "en-GB"); country.put("United States", "en-US"); country.put("Iran", "fa-IR"); country.put("France", "fr-FR"); country.put("Philippines", "fil-PH"); country.put("Spain", "gl-ES"); country.put("Germany", "de-DE"); country.put("Greece", "el-GR"); country.put("Finland", "fi-FI"); country.put("Israel", "he-IL"); country.put("India", "hi-IN"); country.put("Hungary", "hu-HU"); country.put("Indonesia", "id-ID"); country.put("Iceland", "is-IS"); country.put("Italy", "it-IT"); country.put("Switzerland", "it-CH"); country.put("Japan", "ja-JP"); country.put("Korea", "ko-KR"); country.put("Lithuania", "lt-LT"); country.put("Malaysia", "ms-MY"); country.put("Netherlands", "nl-NL"); country.put("Norway", "nb-NO"); country.put("Poland", "pl-PL"); country.put("Brazil", "pt-BR"); country.put("Portugal", "pt-PT"); country.put("Romania", "ro-RO"); country.put("Russia", "ru-RU"); country.put("Serbia", "sr-RS"); country.put("Slovakia", "sk-SK"); country.put("Slovenia", "sl-SI"); country.put("Argentina", "es-AR"); country.put("Bolivia", "es-BO"); country.put("Chile", "es-CL"); country.put("Colombia", "es-CO"); country.put("Costa Rica", "es-CR"); country.put("Dominican Republic", "es-DO"); country.put("Ecuador", "es-EC"); country.put("El Salvador", "es-SV"); country.put("Guatemala", "es-GT"); country.put("Honduras", "es-HN"); country.put("México", "es-MX"); country.put("Nicaragua", "es-NI"); country.put("Panamá", "es-PA"); country.put("Paraguay", "es-PY"); country.put("Perú", "es-PE"); country.put("Puerto Rico", "es-PR"); country.put("Spain", "es-ES"); country.put("Uruguay", "es-UY"); country.put("United States", "es-US"); country.put("Venezuela", "es-VE"); country.put("Sweden", "sv-SE"); country.put("Thailand", "th-TH"); country.put("Turkey", "tr-TR"); country.put("Ukraine", "uk-UA"); country.put("Viet Nam", "vi-VN"); country.put("South Africa", "zu-ZA");


Ok, si no está publicado, podemos intentar al menos resolver esto. Permítame poner esta tabla para el principio y la refinaremos si alguien tiene más información.

Supongo que los idiomas admitidos serán similares a los admitidos por la búsqueda por voz y que Google utiliza códigos de idioma estándar y lo hace de forma coherente en todos sus servicios.

He buscado idiomas soportados por búsqueda por voz en wikipedia

He encontrado códigos de idioma here , en la página de configuración de idioma de Google y here

EDITAR: He experimentado con el servicio de reconocimiento de voz backend. He ejecutado una serie de pruebas en las que he pasado la misma muestra de habla inglesa a la API pero siempre he especificado un dialecto diferente. Parece que:

  • Si un idioma no es compatible, el reconocimiento vuelve a en-US (parece que reconoce que la muestra está en inglés)
  • Si un dialecto no es compatible (o no existe), el reconocimiento recae en el dialecto principal o en-US en algunos casos
  • El dialecto principal se puede especificar como primera parte del identificador. Así que ''en-US'' y ''en'' dan los mismos resultados.
  • Sin embargo, el reconocimiento para algunos idiomas, como el chino y el japonés, da resultados en inglés, diferentes de los en-US, lo cual es extraño. Probablemente la muestra sea muy diferente del chino y el servicio es inteligente para resolverlo.

Considero que un dialecto es compatible si el reconocimiento da un resultado diferente de en-US y del dialecto principal para el idioma. Aún así, para verificarlo al 100% necesitamos ejecutar muestras para cada idioma.

Leyenda

  • + Más que nada, porque la prueba da un resultado diferente de en-US y dialecto principal.
  • .+ Ausente en wikipedia, pero sobre todo compatible, porque la prueba da un resultado diferente al de en-US y el dialecto principal.
  • +? La mayoría de todos los apoyan porque está listado en wikipedia. Pero la prueba en mi muestra da un resultado idéntico al dialecto principal. Entonces, o bien este es un coinidense o el código de idioma es incorrecto.
  • .+? No aparece en la wikipedia, pero parece compatible, porque la prueba da un resultado diferente al de en-US y el dialecto principal.

Idiomas

  • + Afrikaans af
  • + Eu vasco
  • + Bg búlgaro
  • + Catalán ca
  • + Árabe (Egipto) ar-EG
  • +? Árabe (jordan) ar-jo
  • + Árabe (Kuwait) ar-KW
  • +? Árabe (Líbano) ar-LB
  • + Árabe (Qatar) ar-QA
  • + Árabe (EAU) ar-AE
  • .+ Árabe (Marruecos) ar-MA
  • .+ Árabe (Iraq) ar-IQ
  • .+ Árabe (Argelia) ar-DZ
  • .+ Árabe (Bahrein) ar-BH
  • .+ Árabe (Libia) ar-LY
  • .+ Árabe (Omán) ar-OM
  • .+ Árabe (Arabia Saudita) ar-SA
  • .+ Árabe (Túnez) ar-TN
  • .+ Árabe (Yemen) ar-YE
  • + Checo cs
  • + Holandés nl-NL
  • + Inglés (Australia) en-AU
  • +? Inglés (Canadá) en-CA
  • + Inglés (India) en-IN
  • + Inglés (Nueva Zelanda) en-NZ
  • + Inglés (Sudáfrica) en-ZA
  • + Inglés (UK) en-GB
  • + Inglés (US) en-US
  • + Fi finlandés
  • + Francés fr-FR
  • + Gl gallego
  • + Alemán DE-DE
  • + Hebreo el
  • + Hu húngaro
  • + Islandés es
  • + Italiano it-it
  • + ID de Indonesia
  • + Ja japonés
  • + Ko coreano
  • + Latín la
  • + Chino mandarín zh-CN
  • + Taiwán tradicional zh-TW
  • +? China simplificada zh-CN ?
  • + Hong Kong simplificado zh-HK
  • + Yue chino (tradicional Hong Kong) zh-yue
  • + Ms-MY malayo
  • + Noruego no-NO
  • + Polaco pl
  • +? Cerdo Latin xx-piglatin
  • + Pt-PT portugués
  • .+ Portugués (brasil) pt-BR
  • + RO- rumano
  • + Ru ruso
  • + Sr-SP serbio
  • + Sk eslovaco
  • + Español (Argentina) es-AR
  • + Español (Bolivia) es-BO
  • +? Español (Chile) es-CL
  • +? Español (Colombia) es-CO
  • +? Español (costa rica) es-CR
  • + Español (República Dominicana) es-DO
  • + Español (ecuador) es-EC
  • + Español (El Salvador) es-SV
  • + Español (Guatemala) es-GT
  • + Español (Honduras) es-HN
  • + Español (México) es-MX
  • + Español (nicaragua) es-NI
  • + Español (panamá) es-PA
  • + Español (Paraguay) es-PY
  • + Español (Perú) es-PE
  • + Español (Puerto Rico) es-PR
  • + Español (España) es-ES
  • + Español (US) es-US
  • + Español (Uruguay) es-UY
  • + Español (Venezuela) es-VE
  • + Sueco sv-SE
  • + Turco tr
  • + Zulu zu

Sé que esta es una publicación antigua, pero como es difícil encontrar esta información, pensé que publicaría una lista para cualquiera que pudiera estar buscando. Por favor, deje una nota si encuentra algún error u omisión.

{ "Afrikaans": [ ["South Africa", "af-ZA"] ], "Arabic" : [ ["Algeria","ar-DZ"], ["Bahrain","ar-BH"], ["Egypt","ar-EG"], ["Israel","ar-IL"], ["Iraq","ar-IQ"], ["Jordan","ar-JO"], ["Kuwait","ar-KW"], ["Lebanon","ar-LB"], ["Morocco","ar-MA"], ["Oman","ar-OM"], ["Palestinian Territory","ar-PS"], ["Qatar","ar-QA"], ["Saudi Arabia","ar-SA"], ["Tunisia","ar-TN"], ["UAE","ar-AE"] ], "Basque": [ ["Spain", "eu-ES"] ], "Bulgarian": [ ["Bulgaria", "bg-BG"] ], "Catalan": [ ["Spain", "ca-ES"] ], "Chinese Mandarin": [ ["China (Simp.)", "cmn-Hans-CN"], ["Hong Kong SAR (Trad.)", "cmn-Hans-HK"], ["Taiwan (Trad.)", "cmn-Hant-TW"] ], "Chinese Cantonese": [ ["Hong Kong", "yue-Hant-HK"] ], "Croatian": [ ["Croatia", "hr_HR"] ], "Czech": [ ["Czech Republic", "cs-CZ"] ], "Danish": [ ["Denmark", "da-DK"] ], "English": [ ["Australia", "en-AU"], ["Canada", "en-CA"], ["India", "en-IN"], ["Ireland", "en-IE"], ["New Zealand", "en-NZ"], ["Philippines", "en-PH"], ["South Africa", "en-ZA"], ["United Kingdom", "en-GB"], ["United States", "en-US"] ], "Farsi": [ ["Iran", "fa-IR"] ], "French": [ ["France", "fr-FR"] ], "Filipino": [ ["Philippines", "fil-PH"] ], "Galician": [ ["Spain", "gl-ES"] ], "German": [ ["Germany", "de-DE"] ], "Greek": [ ["Greece", "el-GR"] ], "Finnish": [ ["Finland", "fi-FI"] ], "Hebrew" :[ ["Israel", "he-IL"] ], "Hindi": [ ["India", "hi-IN"] ], "Hungarian": [ ["Hungary", "hu-HU"] ], "Indonesian": [ ["Indonesia", "id-ID"] ], "Icelandic": [ ["Iceland", "is-IS"] ], "Italian": [ ["Italy", "it-IT"], ["Switzerland", "it-CH"] ], "Japanese": [ ["Japan", "ja-JP"] ], "Korean": [ ["Korea", "ko-KR"] ], "Lithuanian": [ ["Lithuania", "lt-LT"] ], "Malaysian": [ ["Malaysia", "ms-MY"] ], "Dutch": [ ["Netherlands", "nl-NL"] ], "Norwegian": [ ["Norway", "nb-NO"] ], "Polish": [ ["Poland", "pl-PL"] ], "Portuguese": [ ["Brazil", "pt-BR"], ["Portugal", "pt-PT"] ], "Romanian": [ ["Romania", "ro-RO"] ], "Russian": [ ["Russia", "ru-RU"] ], "Serbian": [ ["Serbia", "sr-RS"] ], "Slovak": [ ["Slovakia", "sk-SK"] ], "Slovenian": [ ["Slovenia", "sl-SI"] ], "Spanish": [ ["Argentina", "es-AR"], ["Bolivia", "es-BO"], ["Chile", "es-CL"], ["Colombia", "es-CO"], ["Costa Rica", "es-CR"], ["Dominican Republic", "es-DO"], ["Ecuador", "es-EC"], ["El Salvador", "es-SV"], ["Guatemala", "es-GT"], ["Honduras", "es-HN"], ["México", "es-MX"], ["Nicaragua", "es-NI"], ["Panamá", "es-PA"], ["Paraguay", "es-PY"], ["Perú", "es-PE"], ["Puerto Rico", "es-PR"], ["Spain", "es-ES"], ["Uruguay", "es-UY"], ["United States", "es-US"], ["Venezuela", "es-VE"] ], "Swedish": [ ["Sweden", "sv-SE"] ], "Thai": [ ["Thailand", "th-TH"] ], "Turkish": [ ["Turkey", "tr-TR"] ], "Ukrainian": [ ["Ukraine", "uk-UA"] ], "Vietnamese": [ ["Viet Nam", "vi-VN"] ], "Zulu": [ ["South Africa", "zu-ZA"] ] }

Edición: también encontré esta lista, que probablemente sea más actual: https://cloud.google.com/speech-to-text/docs/languages


Use el siguiente código para obtener todas las voces disponibles para la API de voz en su navegador:

var voices = speechSynthesis.getVoices(); for(var i = 0; i < voices.length; i++ ) { console.log("Voice " + i.toString() + '' '' + voices[i].name + '' '' + voices[i].uri); }

En este momento solo Chrome y Safari son compatibles con la API de Web Speech (aunque Safari solo es compatible con las funcionalidades de Texto a voz). Curiosamente, Firefox OS es compatible con TTS, pero la versión del navegador no.

La lista de idiomas depende del navegador en el que se encuentre, de acuerdo con la documentación y mis pruebas (dependiente del agente de usuario).

En Safari también tienes muchos idiomas disponibles (creo que más de 40). En Chrome, en este momento obtienes la siguiente lista:

Voz 0 Google US English undefined

Voz 1 Google Reino Unido Inglés Hombre indefinido

Voz 2 Google Reino Unido Inglés Mujer indefinido

Voz 3 Google Español undefined

Voz 4 Google Français undefined

Voz 5 Google Italiano undefined

Voz 6 Google Deutsch undefined

Voz 7 Google 日本人 indefinido

Voz 8 Google 한국 의 undefined

Voz 9 Google no está definido

Voz 10 nativa indefinida