python voice-recognition speech

Reconocimiento de Altavoz Python



subplot title python (4)

Tengo un archivo de audio (conversación telefónica grabada de 2 personas). Necesito separar las voces de 2 parlantes automáticamente. Soy nuevo en el reconocimiento de voz y miré el módulo de wave de python pero faild para encontrar información fructífera.

Por favor ayuda como empezar. También, por favor, sugiérame bibliotecas gratuitas de Python que me ayudarán a resolver el problema.





La tarea de separación de los oradores no es una tarea de reconocimiento de voz, es una tarea de reconocimiento de oradores. En la comunidad del discurso, esta tarea también se conoce como diarización del hablante. Hay varios paquetes para la diarización de los oradores y el reconocimiento de parlantes disponibles para Python:

SIDEKIT de LIUM

Kit de herramientas Bob de Idiap

Agenda de ponentes de ISCI

En caso de que no estés restringido a Python, hay otros:

Diarización del hablante

Configuración de reconocimiento de altavoz en Kaldi . Incluye los i-vectores basados ​​en DNN llamados x-vectores.