with recognition learning code and image-processing computer-vision object-detection

image-processing - learning - object recognition opencv



Procesamiento de imágenes: ¿qué son las oclusiones? (4)

Estoy desarrollando un proyecto de procesamiento de imágenes y encuentro la palabra oclusión en muchos artículos científicos, ¿qué significan las oclusiones en el contexto del procesamiento de imágenes? El diccionario solo está dando una definición general. ¿Alguien puede describirlos usando una imagen como contexto?


Como las otras respuestas explicaron bien la oclusión, solo agregaré eso. Básicamente, existe una brecha semántica entre nosotros y las computadoras.

La computadora realmente ve cada imagen como la secuencia de valores, típicamente en el rango 0-255, para cada color en la Imagen RGB. Estos valores están indexados en forma de (fila, col) para cada punto de la imagen. Entonces, si los objetos cambian su posición en la cámara donde se oculta algún aspecto del objeto (las manos de una persona no se muestran), la computadora verá diferentes números (o bordes o cualquier otra característica), de modo que esto cambiará para que el algoritmo de la computadora detectar, reconocer o rastrear el objeto.


El problema de la oclusión es una de las principales razones por las cuales la visión artificial es difícil en general. Específicamente, esto es mucho más problemático en Object Tracking . Vea las siguientes figuras:

Tenga en cuenta que la cara de la dama no es completamente visible en los marcos 0519 y 0835 en comparación con la cara en el marco 0005 .

Y aquí hay una imagen más donde la cara del hombre está parcialmente oculta en los tres cuadros.

Observe en la imagen de abajo cómo el seguimiento de la pareja en el cuadro delimitador rojo y verde se pierde en el cuadro medio debido a la oclusión (es decir, parcialmente oculto por otra persona delante de ellos) pero se rastrea correctamente en el último cuadro cuando se vuelven ( casi ) completamente visible.

Cortesía de la imagen: Stanford, USC


La oclusión es la que bloquea nuestra vista. En la imagen que se muestra aquí, podemos ver fácilmente a las personas en la primera fila. Pero la segunda fila es parcialmente visible y la tercera fila es mucho menos visible. Aquí, decimos que la segunda fila está parcialmente ocluida por la primera fila, y la tercera fila está ocluida por la primera y la segunda fila. Podemos ver tales oclusiones en las salas de clase (estudiantes sentados en filas), intersecciones de tráfico (vehículos esperando la señal), bosques (árboles y plantas), etc., cuando hay muchos objetos.


La oclusión significa que hay algo que desea ver, pero no puede debido a alguna propiedad de la configuración de su sensor, o algún evento. Exactamente cómo se manifiesta o cómo lidiar con el problema variará debido al problema en cuestión .

Algunos ejemplos:

Si está desarrollando un sistema que rastrea objetos (personas, autos, ...), la oclusión ocurre si un objeto que está rastreando está oculto (ocluido) por otro objeto. Como dos personas que se cruzan, o un automóvil que pasa por debajo de un puente. El problema en este caso es lo que haces cuando un objeto desaparece y vuelve a aparecer.

Si está utilizando una cámara de rango , entonces la oclusión es áreas donde no tiene ninguna información. Algunas cámaras de rango láser funcionan transmitiendo un rayo láser a la superficie que está examinando y luego tienen una configuración de cámara que identifica el punto de impacto de ese láser en la imagen resultante. Eso da las coordenadas 3D de ese punto. Sin embargo, dado que la cámara y el láser no están necesariamente alineados, puede haber puntos en la superficie examinada que la cámara puede ver pero que el láser no puede alcanzar (oclusión). El problema aquí es más una cuestión de configuración del sensor.

Lo mismo puede ocurrir en las imágenes estéreo si hay partes de la escena que solo son vistas por una de las dos cámaras. Obviamente, no se pueden recopilar datos de rango de estos puntos.

Probablemente hay más ejemplos.

Si especifica su problema, entonces tal vez podamos definir qué oclusión es en ese caso, y qué problemas implica