vibraciones unilateral una transformada tiempo teorema señal senoidal nyquist frecuencia fourier espectro espectral eléctrica dominio cosenoidal bilateral analisis audio signal-processing fft spectrum window-functions

unilateral - ¿Por qué necesito aplicar una función de ventana a las muestras al crear un espectro de potencia de una señal de audio?



teorema de nyquist (4)

Como dice @ cyco130, sus muestras ya están en una ventana con una función rectangular. Dado que una Transformada de Fourier asume periodicidad, cualquier discontinuidad entre la última muestra y la primera muestra repetida causará artefactos en el espectro (por ejemplo, "manchas" de los picos). Esto se conoce como fuga espectral . Para reducir el efecto de esto, aplicamos una función de ventana cónica como una ventana de Hann que suaviza cualquier discontinuidad y, por lo tanto, reduce los artefactos en el espectro.

He encontrado varias veces las siguientes pautas para obtener el espectro de potencia de una señal de audio:

  • Recoge N muestras, donde N es una potencia de 2.
  • aplicar una función de ventana adecuada a las muestras, por ejemplo, Hanning
  • pase las muestras de la ventana a una rutina de FFT; idealmente, desea una FFT de real a compleja, pero si todo lo que tiene es una FFT de compleja a compleja, luego pase 0 para todas las partes de entrada imaginarias
  • calcula la magnitud cuadrada de tus bandejas de salida FFT (re * re + im * im)
  • (opcional) calcule 10 * log10 de cada bandeja de salida de magnitud cuadrada para obtener un valor de magnitud en dB
  • Ahora que tiene su espectro de potencia, solo necesita identificar el (los) pico (s), lo que debería ser bastante sencillo si tiene una relación S / N razonable. Tenga en cuenta que la resolución de frecuencia mejora con N. más grande. Para el ejemplo anterior de 44.1 kHz de frecuencia de muestreo y N = 32768, la resolución de frecuencia de cada contenedor es 44100/32768 = 1.35 Hz.

Pero ... ¿por qué necesito aplicar una función de ventana a las muestras? ¿Qué significa eso realmente?

¿Qué pasa con el espectro de potencia, es la potencia de cada frecuencia en el rango de frecuencia de muestreo? (Ejemplo: Windows Media Player, visualizador de sonido?)


La mayoría de las señales de audio del mundo real no son periódicas, lo que significa que las señales de audio reales generalmente no se repiten exactamente en un lapso de tiempo determinado.

Sin embargo, la matemática de la transformada de Fourier supone que la señal que se está transformando con Fourier es periódica durante el intervalo de tiempo en cuestión.

Este desajuste entre el supuesto de periodicidad de Fourier y el hecho del mundo real de que las señales de audio generalmente no son periódicas, conduce a errores en la transformación.

Estos errores se denominan "fugas espectrales" y, en general, se manifiestan como una distribución errónea de energía en todo el espectro de potencia de la señal.

La siguiente gráfica muestra un primer plano del espectro de potencia de una guitarra acústica tocando la nota A4. El espectro se calculó con la FFT (transformada rápida de Fourier), pero la señal no se ocultó antes de la FFT.

Observe la distribución de energía por encima de la línea de -60 dB y los tres picos distintos a aproximadamente 440 Hz, 880 Hz y 1320 Hz. Esta distribución particular de energía contiene errores de "fuga espectral".

Para mitigar un poco los errores de "fuga espectral", puede multiplicar previamente la señal por una función de ventana diseñada específicamente para ese propósito, como por ejemplo la función de ventana de Hann.

La siguiente gráfica muestra la función de la ventana de Hann en el dominio del tiempo. Observe cómo las colas de la función van suavemente a cero, mientras que la parte central de la función tiende suavemente hacia el valor 1.

Ahora apliquemos la ventana de Hann a los datos de audio de la guitarra y luego a FFT la señal resultante.

La siguiente gráfica muestra un primer plano del espectro de potencia de la misma señal (una guitarra acústica que toca la nota A4), pero esta vez la señal se multiplicó previamente por la función de la ventana de Hann antes de la FFT.

Observe cómo la distribución de energía por encima de la línea de -60 dB ha cambiado significativamente y cómo los tres picos distintos han cambiado de forma y altura. Esta distribución particular de energía espectral contiene menos errores de "fuga espectral".

La nota A4 de la guitarra acústica utilizada para este análisis fue muestreada a 44.1 KHz con un micrófono de alta calidad en condiciones de estudio, no contiene prácticamente ningún ruido de fondo, ningún otro instrumento o voces, ni procesamiento posterior.

Referencias:

Aquí se realizaron datos de señal de audio real, función de ventana de Hann, gráficos, FFT y análisis espectral:

Transformada rápida de Fourier, análisis espectral, función de ventana de Hann, datos de audio


Si no está aplicando ninguna función de ventana, en realidad está aplicando una función de ventana rectangular. Las diferentes funciones de ventanas tienen diferentes características, depende de lo que quiera exactamente.


Tenga en cuenta que una ventana no rectangular tiene tanto beneficios como costos. El resultado de una ventana en el dominio del tiempo es equivalente a una convolución de la transformación de la ventana con el espectro de la señal. Una ventana típica, como una ventana de von Hann, reducirá la "fuga" de cualquier contenido espectral no periódico, lo que dará como resultado un espectro de aspecto menos ruidoso; pero, a cambio, la convolución "desenfocará" exactamente o cerca de los picos espectrales periódicos a través de unos cuantos contenedores adyacentes. por ejemplo, todos los picos espectrales se volverán más redondos, lo que puede reducir la precisión de la estimación de frecuencia. Si sabe, a priori, que no hay contenido no periódico (p. Ej., Datos de algún sistema de muestreo síncrono de rotación), una ventana no rectangular podría hacer que la FFT se vea peor.

Una ventana no rectangular es también un proceso con pérdida informativa. Se desechará una cantidad significativa de información espectral cerca de los bordes de la ventana, suponiendo una aritmética de precisión finita. Por lo tanto, las ventanas no rectangulares se utilizan mejor con el procesamiento de ventanas superpuestas, y / o cuando se puede suponer que el espectro de interés es estacionario en todo el ancho de la ventana, o centrado en la ventana.