tutorial supervisada semi plugin español clasificacion automatic image-processing definition energy

image processing - supervisada - ¿Qué es la “energía” en el procesamiento de imágenes?



semi automatic classification plugin en español (13)

Depende del contexto, pero en general, en Procesamiento de señales, "energía" corresponde al valor cuadrático medio de la señal (medido típicamente con respecto al valor medio global). Este concepto suele asociarse con el teorema de Parseval , que nos permite pensar en la energía total como distribuida a lo largo de "frecuencias" (y, por lo tanto, se puede decir, por ejemplo, que una imagen tiene la mayor parte de su energía concentrada en bajas frecuencias).

Otro uso relacionado es en las transformaciones de imagen: por ejemplo, la transformación DCT (base del método de compresión JPEG) transforma un bloque de píxeles (imagen 8x8) en una matriz de coeficientes transformados; para las imágenes típicas, resulta que, mientras que la imagen original de 8x8 tiene su energía distribuida uniformemente entre los 64 píxeles, la imagen transformada tiene su energía concentrada en los "píxeles" de la izquierda superior (que, de nuevo, corresponden a "bajas frecuencias", en cierto sentido análogo).

He leído en varios libros y sitios web de procesamiento de imágenes, pero aún no estoy seguro de la verdadera definición del término "energía" en el procesamiento de imágenes. He encontrado varias definiciones pero a veces simplemente no coinciden. Así que para estar seguro ...

Cuando decimos "energía" en el procesamiento de imágenes, ¿qué estamos implicando?


El algoritmo Snake es una técnica de procesamiento de imágenes que se utiliza para determinar el contorno de un objeto, la serpiente no es más que un vector de (X, Y) puntos con algunas restricciones, su objetivo final es rodear el objeto y describir su forma (contorno) y luego para rastrear o representar el objeto por su forma.

El algoritmo tiene dos tipos de energías, internas y externas.

La energía interna (la energía de la serpiente) (IE) es una energía definida por el usuario que actúa sobre la serpiente (internamente) para imponer restricciones a la suavidad de la serpiente. Sin esa fuerza, la forma de la serpiente terminará con la forma exacta del objeto. , esto no es deseable, porque la forma exacta de un objeto es muy difícil de obtener, debido a las condiciones de luz, la calidad de la imagen, el ruido, etc.

La energía externa (EE) surge de los datos (las intensidades de la imagen), y no es más que la diferencia absoluta de las intensidades en las direcciones x e y (el gradiente de intensidad) multiplicada por -1, que se suma a la energía interna. Porque la energía total debe ser minimizada. por lo tanto, se debe minimizar la energía total para todo el punto de serpiente. Idealmente, esto se hace realidad cuando hay bordes, porque el gradiente en el borde o (EE) se maximiza, y como se multiplica por -1, la energía total de La serpiente alrededor del objeto más cercano se minimiza, y por lo tanto el algoritmo converge a una solución, que es de esperar que sea el verdadero contorno del objeto estudiado.

Debido a que este algoritmo se basa en EE, que no solo es alto en los bordes sino también alto en los puntos ruidosos, a veces el algoritmo de la serpiente no converge en una solución óptima, por lo que es un algoritmo codicioso aproximado.


Encontré esto en el libro de procesamiento de imágenes;

Energía: S_N = sum (from b=0 to b=L-1) of abs(P(b))^2

P(b) = N(b) / M

donde M representa el número total de píxeles en una ventana de vecindario centrada alrededor de (j,k) , y N(b) es el número de píxeles de amplitud en la misma ventana.

Puede darnos una mejor comprensión si vemos esta ecuación con la entropía;

Entropía: S_E = - sum (from b=0 to b=L-1) of P(b)log2{P(b)}

fuente: Pp. 538 ~ 539 Procesamiento de imágenes digitales escrito por William K. Pratt (4ª edición)


Energía es un término bastante vago usado para describir cualquier función definida por el usuario (en el dominio de la imagen).

La motivación para usar el término ''Energía'' es que las tareas típicas de detección / segmentación de objetos se plantean como un problema de minimización de energía. Definimos una energía que capturaría la solución que deseamos y realizaremos el descenso de gradiente para calcular su valor más bajo, lo que resultará en una solución para la segmentación de la imagen.


Hay más de una definición de "energía" en el procesamiento de imágenes, por lo que depende del contexto en el que se usó.

La energía se utiliza para describir una medida de "información" cuando se formula una operación bajo un marco de probabilidad tal como la estimación MAP (máxima a priori) junto con los campos aleatorios de Markov. A veces, la energía puede ser una medida negativa que debe minimizarse y otras veces es una medida positiva para maximizar.



La energía de la imagen se calcula a través de MATLAB usando: image_energy = graycoprops (i1, {''energy''})

**Vedpal Singh**


La energía es como la "información presente en la imagen". La compresión de imágenes causa pérdida de energía. Supongo que es algo así.


La energía es una medida del cambio localizado de la imagen.

La energía obtiene un montón de nombres diferentes y muchos contextos diferentes, pero tiende a referirse a lo mismo. Es la velocidad de cambio en el color / brillo / magnitud de los píxeles en las áreas locales. Esto es especialmente cierto para los bordes de las cosas dentro de la imagen y debido a la naturaleza de la compresión, estas áreas son las más difíciles de comprimir y, por lo tanto, es una suposición sólida de que son más importantes, a menudo son bordes o gradientes rápidos. Estos son los diferentes contextos pero se refieren a lo mismo.

El algoritmo de tallado de costuras usa determinaciones de energía (usa una magnitud de gradiente) para encontrar lo menos notado si se elimina. JPEG representa el grupo local de píxeles en relación con la energía del primero. El algoritmo Snake lo usa para encontrar el borde contorneado local de una cosa en la imagen. Así que hay muchas definiciones diferentes, pero todas se refieren al tipo de empuje de la imagen. Ya sea la suma de los píxeles locales en términos del cuadrado de brillo absoluto o los bits duros para comprimir en un jpeg, o los bordes en la detección de Canny Edge o la magnitud del gradiente:

Lo importante es que la energía es donde están las cosas.

La energía de una imagen más ampliamente es la distancia de cierta calidad entre los píxeles de alguna localidad.

Podemos tomar la suma de las distancias de color LABdE2000 dentro de un kernel gaussiano 2d correctamente ponderado. Aquí las distancias se suman, la localidad está definida por un núcleo gaussiano y la calidad es color y la distancia es la fórmula Delta de LAB del año 2000 (Errata: anteriormente, esta E reclamada era Euclidiana, pero la distancia para el delta E estándar es Euclidiana pero las fórmulas 94 y 00 no son estrictamente euclidianas y la ''E'' significa Empfindung; alemán para "sensación"). También podríamos sumar el núcleo local 3x3 de la diferencia local en el brillo, o el cuadrado del brillo, etc. Necesitamos medir el cambio localizado de la imagen.

En este ejemplo, local se define como un kernel gaussiano 2d y la distancia de color como algoritmo LabDE2000.

Si tomó una imagen y movió todos los píxeles y los ordenó por color por alguna razón. Reducirías la energía de la imagen. Puede tomar una colección de 50% de píxeles negros y 50% de píxeles blancos y organizarlos como ruido aleatorio para obtener la máxima energía o colocarlos como dos lados de la imagen para obtener la mínima energía. Del mismo modo, si tuvieras 100% de píxeles blancos, la energía sería 0, sin importar cómo los hayas organizado.


La energía se define en base a un histograma normalizado de la imagen. La energía muestra cómo se distribuyen los niveles de gris. Cuando el número de niveles de gris es bajo, entonces la energía es alta.


Para mi proyecto de imágenes actual, que es una fuente de luz difusa, me gustaría considerar la energía como energía de luz o energía de radiación. Pregunta que tuve inicialmente: ¿un "valor de píxel" RGB representa la energía de la luz? Se puede afirmar utilizando un medidor de intensidad de luz y generando pantallas subsiguientes con valores de píxeles grises (n, n, n) para 0..255. Según el foro matlabs , la energía radiada de 1 píxel en escala de grises es siempre proporcional a su valor de píxel, pero variará ligeramente de píxel a píxel.

Hay otra suposición con respecto a la energía: mientras realizo el trazado del rayo delantero, obtengo un conteo de rayos en cada golpe de posición muestreada. Este conteo de rayos es, o preferiblemente debería ser, proporcional a la energía de radiación que podría golpear al objetivo en esta posición. Para poder compararlo con las fotografías reales tomadas, tendría que normalizar el recuento de rayos a un rango de valores de píxeles. (?) Adjunto un ejemplo a continuación, la fuente de energía es un emisor de luz difusa dentro de un cilindro oscuro. .


Si considera que (para imágenes naturales capturadas por cámaras) la luz es una energía, puede llamar a energía el valor del píxel en algún canal.

Sin embargo, creo que por energía los libros se refieren a la densidad espectral. De wikipedia:

La densidad espectral de energía describe cómo se distribuye con frecuencia la energía (o varianza) de una señal o una serie de tiempo.

http://en.wikipedia.org/wiki/Spectral_density


Volviendo a mi química - Energía y Entropía son términos estrechamente relacionados. Y la entropía y la aleatoriedad también están estrechamente relacionadas. Así que en el procesamiento de imágenes, la energía podría ser similar a la aleatoriedad. Por ejemplo, una imagen de una pared lisa tiene poca energía, mientras que la imagen de una ciudad tomada desde un helicóptero puede tener mucha energía.