Transformación de nivel gris

Hemos discutido algunas de las transformaciones básicas en nuestro tutorial de transformación básica. En este tutorial veremos algunas de las transformaciones básicas del nivel de gris.

Mejora de la imagen

Mejorar una imagen proporciona un mejor contraste y una imagen más detallada en comparación con la imagen no mejorada. La mejora de imágenes tiene muchas aplicaciones. Se utiliza para mejorar imágenes médicas, imágenes capturadas por teledetección, imágenes de satélite, etc.

La función de transformación se ha dado a continuación

s = T (r)

donde r son los píxeles de la imagen de entrada y s son los píxeles de la imagen de salida. T es una función de transformación que asigna cada valor de r a cada valor de s. La mejora de la imagen se puede realizar mediante transformaciones de nivel de gris que se describen a continuación.

Transformación de nivel de gris

Hay tres transformaciones básicas de nivel de gris.

  • Linear
  • Logarithmic
  • Ley de potencia

El gráfico general de estas transiciones se muestra a continuación.

Transformación lineal

Primero veremos la transformación lineal. La transformación lineal incluye la identidad simple y la transformación negativa. La transformación de identidad se ha discutido en nuestro tutorial de transformación de imágenes, pero aquí se ofrece una breve descripción de esta transformación.

La transición de identidad se muestra con una línea recta. En esta transición, cada valor de la imagen de entrada se asigna directamente a los demás valores de la imagen de salida. Eso da como resultado la misma imagen de entrada y la misma imagen de salida. Y por eso se llama transformación de identidad. Se ha mostrado a continuación:

Transformación negativa

La segunda transformación lineal es la transformación negativa, que es inversa de la transformación de identidad. En la transformación negativa, cada valor de la imagen de entrada se resta del L-1 y se asigna a la imagen de salida.

El resultado es algo así.

Imagen de entrada

Imagen de salida

En este caso, se ha realizado la siguiente transición.

s = (L - 1) - r

dado que la imagen de entrada de Einstein es una imagen de 8 bpp, por lo que el número de niveles en esta imagen es 256. Poniendo 256 en la ecuación, obtenemos este

s = 255 - r

Entonces, cada valor se resta por 255 y la imagen del resultado se muestra arriba. Entonces, lo que sucede es que los píxeles más claros se oscurecen y la imagen más oscura se vuelve clara. Y da como resultado una imagen negativa.

Se ha mostrado en el gráfico siguiente.

Transformaciones logarítmicas

La transformación logarítmica contiene además dos tipos de transformación. Transformación logarítmica y transformación logarítmica inversa.

Transformación de registros

Las transformaciones logarítmicas se pueden definir mediante esta fórmula

s = c log (r + 1).

Donde syr son los valores de píxeles de la salida y la imagen de entrada yc es una constante. El valor 1 se suma a cada valor de píxel de la imagen de entrada porque si hay una intensidad de píxel de 0 en la imagen, entonces log (0) es igual a infinito. Entonces se agrega 1, para hacer que el valor mínimo sea al menos 1.

Durante la transformación de registro, los píxeles oscuros de una imagen se expanden en comparación con los valores de píxeles más altos. Los valores de píxel más altos se comprimen en forma de transformación logarítmica. Esto da como resultado la siguiente mejora de la imagen.

El valor de c en la transformación de registro ajusta el tipo de mejora que está buscando.

Imagen de entrada

Imagen de transformación de registro

La transformación logarítmica inversa es opuesta a la transformación logarítmica.

Transformaciones de Poder - Ley

Hay dos transformaciones más: transformaciones de ley de potencia, que incluyen la enésima transformación de potencia y la enésima raíz. Estas transformaciones pueden estar dadas por la expresión:

s = cr ^ γ

Este símbolo γ se llama gamma, por lo que esta transformación también se conoce como transformación gamma.

La variación en el valor de γ varía la mejora de las imágenes. Los diferentes dispositivos de visualización / monitores tienen su propia corrección de gamma, por eso muestran su imagen con diferente intensidad.

Este tipo de transformación se utiliza para mejorar imágenes para diferentes tipos de dispositivos de visualización. La gama de diferentes dispositivos de visualización es diferente. Por ejemplo, Gamma de CRT se encuentra entre 1.8 y 2.5, eso significa que la imagen mostrada en CRT es oscura.

Corrección de gamma.

s = cr ^ γ

s = cr ^ (1 / 2.5)

Aquí se muestra la misma imagen pero con diferentes valores de gamma.

Por ejemplo

Gamma = 10

Gamma = 8

Gamma = 6