audio - online - speech to text software
¿Cómo convierto el discurso a texto? (4)
¿Cómo podría tomar MP3 y convertir el discurso en texto?
Tengo algunas notas grabadas de una conferencia y de reuniones (hay una sola voz en la grabación, que es mi voz). Pensé que sería más fácil e intelectualmente interesante convertir a texto usando herramientas de voz a texto en lugar de simplemente transcribir a mano. Sé que existen tecnologías, especialmente para aplicaciones de VoIP que usan Asterisk y Podcasts, pero ¿qué son y cómo puedo usarlas?
.NET puede hacerlo con su espacio de nombres System.Speech.
Tendría que convertir a .wav primero o capturar el audio en vivo desde el micrófono.
Los detalles sobre la implementación se pueden encontrar aquí: Transcribiendo audio con .NET
Fuente abierta: CMU Sphinx
Shareware: http://www.e-speaking.com/ (Windows)
Comercial: Dragon NaturallySpeaking (Windows)
Tarde a la fiesta, así que respondo más para futuras referencias.
Avances en el campo + La mentalidad y la agenda de Mozilla llevaron a estos dos proyectos hacia ese objetivo:
Este último tiene un conjunto de datos de 12 GB para descargar. El primero me permite entrenar un modelo con tus propios archivos de audio.
Dragon NaturallySpeaking parece ser compatible con la entrada de MP3.
Si quieres una versión de código abierto (creo que hay algunos proyectos de integración de Asterisk basados en este).