Concepto de convolución

Este tutorial trata sobre uno de los conceptos más importantes de señales y sistema. Discutiremos completamente la convolución. ¿Qué es? ¿Por qué es? ¿Qué podemos lograr con él?

Comenzaremos a discutir la convolución desde los conceptos básicos del procesamiento de imágenes.

¿Qué es el procesamiento de imágenes?

Como hemos comentado en la introducción a los tutoriales de procesamiento de imágenes y en la señal y el sistema, el procesamiento de imágenes es más o menos el estudio de señales y sistemas porque una imagen no es más que una señal bidimensional.

También hemos comentado que en el procesamiento de imágenes estamos desarrollando un sistema cuya entrada es una imagen y la salida sería una imagen. Esto se representa pictóricamente como.

La caja que se muestra en la figura anterior etiquetada como "Sistema de procesamiento de imágenes digitales" podría considerarse una caja negra.

Se puede representar mejor como:

A donde hemos llegado hasta ahora

Hasta ahora hemos discutido dos métodos importantes para manipular imágenes. O en otras palabras, podemos decir que nuestra caja negra funciona de dos formas diferentes hasta ahora.

Las dos formas diferentes de manipular imágenes fueron

Gráficos (histogramas)

Este método se conoce como procesamiento de histogramas. Lo hemos discutido en detalle en tutoriales anteriores para aumentar el contraste, mejorar la imagen, el brillo, etc.

Funciones de transformación

Este método se conoce como transformaciones, en el que discutimos diferentes tipos de transformaciones y algunas transformaciones de nivel de gris.

Otra forma de tratar las imágenes

Aquí vamos a discutir otro método para tratar las imágenes. Este otro método se conoce como convolución. Por lo general, la caja negra (sistema) que se utiliza para el procesamiento de imágenes es un sistema LTI o un sistema invariante en el tiempo lineal. Por lineal nos referimos a un sistema en el que la salida es siempre lineal, ni logarítmica ni exponente ni ningún otro. Y por invariante en el tiempo nos referimos a un sistema que permanece igual durante el tiempo.

Entonces ahora usaremos este tercer método. Puede representarse como.

Se puede representar matemáticamente de dos formas

g(x,y) = h(x,y) * f(x,y)

Puede explicarse como la “máscara convolucionada con una imagen”.

O

g(x,y) = f(x,y) * h(x,y)

Puede explicarse como "imagen convolucionada con máscara".

Hay dos formas de representar esto porque el operador de convolución (*) es conmutativo. La h (x, y) es la máscara o filtro.

¿Qué es la máscara?

La máscara también es una señal. Puede representarse mediante una matriz bidimensional. La máscara suele ser del orden de 1x1, 3x3, 5x5, 7x7. Una máscara siempre debe estar en número impar, porque de lo contrario no se puede encontrar la mitad de la máscara. ¿Por qué necesitamos encontrar la mitad de la máscara? La respuesta se encuentra a continuación, en el tema de, ¿cómo realizar la convolución?

¿Cómo realizar la convolución?

Para realizar la convolución en una imagen, se deben seguir los siguientes pasos.

  • Voltea la máscara (horizontal y verticalmente) solo una vez
  • Desliza la máscara sobre la imagen.
  • Multiplica los elementos correspondientes y luego súmalos
  • Repita este procedimiento hasta que se hayan calculado todos los valores de la imagen.

Ejemplo de convolución

Realicemos una convolución. El paso 1 es darle la vuelta a la máscara.

Máscara

Tomemos nuestra máscara para ser esto.

1 2 3
4 5 6
7 8 9

Voltear la máscara horizontalmente

3 2 1
6 5 4
9 8 7

Voltear la máscara verticalmente

9 8 7
6 5 4
3 2 1

Imagen

Consideremos que una imagen es así

2 4 6
8 10 12
14 dieciséis 18

Circunvolución

Máscara envolvente sobre imagen. Se hace de esta manera. Coloque el centro de la máscara en cada elemento de una imagen. Multiplique los elementos correspondientes y luego agréguelos y pegue el resultado en el elemento de la imagen en el que coloca el centro de la máscara.

El cuadro en color rojo es la máscara y los valores en naranja son los valores de la máscara. El cuadro de color negro y los valores pertenecen a la imagen. Ahora, para el primer píxel de la imagen, el valor se calculará como

Primer píxel = (5 * 2) + (4 * 4) + (2 * 8) + (1 * 10)

= 10 + 16 + 16 + 10

= 52

Coloque 52 en la imagen original en el primer índice y repita este procedimiento para cada píxel de la imagen.

Por qué convolución

La convolución puede lograr algo que los dos métodos anteriores de manipulación de imágenes no pueden lograr. Estos incluyen desenfoque, nitidez, detección de bordes, reducción de ruido, etc.