Reconocimiento de voz

La modalidad biométrica de reconocimiento de voz es una combinación de modalidades fisiológicas y conductuales. El reconocimiento de voz no es más que reconocimiento de sonido. Se basa en características influenciadas por:

  • Physiological Component - Forma física, tamaño y salud de las cuerdas vocales, labios, dientes, lengua y cavidad bucal de una persona.

  • Behavioral Component - Estado emocional de la persona al hablar, acentos, tono, tono, ritmo de conversación, murmullos, etc.

Sistema de reconocimiento de voz

El reconocimiento de voz también se denomina reconocimiento de locutor. En el momento de la inscripción, el usuario debe pronunciar una palabra o frase en un micrófono. Esto es necesario para adquirir una muestra de voz de un candidato.

La señal eléctrica del micrófono se convierte en señal digital mediante un convertidor analógico a digital (ADC). Se registra en la memoria de la computadora como una muestra digitalizada. A continuación, el ordenador compara e intenta hacer coincidir la voz de entrada del candidato con la muestra de voz digitalizada almacenada e identifica al candidato.

Modalidades de reconocimiento de voz

Hay dos variantes de reconocimiento de voz: speaker dependent y speaker independent.

El reconocimiento de voz dependiente del hablante se basa en el conocimiento de las características de voz particulares del candidato. Este sistema aprende esas características a través del entrenamiento de voz (o inscripción).

  • El sistema debe capacitarse para que los usuarios lo acostumbren a un acento y tono en particular antes de emplearlo para reconocer lo que se dijo.

  • Es una buena opción si solo un usuario va a utilizar el sistema.

Los sistemas independientes del hablante pueden reconocer el habla de diferentes usuarios al restringir los contextos del habla, como palabras y frases. Estos sistemas se utilizan para interfaces telefónicas automatizadas.

  • No requieren la formación del sistema en cada usuario individual.

  • Son una buena opción para que las utilicen diferentes personas cuando no es necesario reconocer las características del habla de cada candidato.

Diferencia entre voz y reconocimiento de voz

El reconocimiento de locutor y el reconocimiento de voz se toman erróneamente como lo mismo; pero son tecnologías diferentes. Veamos cómo ...

Reconocimiento de altavoz (reconocimiento de voz) Reconocimiento de voz
El objetivo del reconocimiento de voz es reconocer quién está hablando. El reconocimiento de voz tiene como objetivo comprender y comprender QUÉ se habló.
Se utiliza para identificar a una persona analizando su tono, tono de voz y acento. Se utiliza en la navegación por menús, mapas o computación de manos libres.

Méritos del reconocimiento de voz

  • Es fácil de implementar.

Deméritos del reconocimiento de voz

  • Es susceptible a la calidad del micrófono y al ruido.
  • La incapacidad de controlar los factores que afectan el sistema de entrada puede disminuir significativamente el rendimiento.

  • Algunos sistemas de verificación de locutores también son susceptibles a ataques de suplantación de identidad mediante voz grabada.

Aplicaciones del reconocimiento de voz

  • Realización de transacciones telefónicas e internet.
  • Trabajar con sistemas bancarios y de salud basados ​​en Interactive Voice Response (IRV).

  • Aplicación de firmas de audio para documentos digitales.
  • En entretenimiento y servicios de emergencia.
  • En sistemas educativos en línea.