yourself tag roast preguntas challenge opencv feature-detection surf template-matching video-tracking

opencv - preguntas - roast yourself tag



¿Qué representan exactamente el tamaño y la respuesta en un punto clave SURF? (2)

Estoy usando OpenCV 2.3 para la detección y comparación de puntos clave. Pero estoy un poco confundido con los parámetros de size y response dados por el algoritmo de detección. ¿Qué significan exactamente?

Basado en el manual de OpenCV, no puedo entenderlo:

float size : diámetro de la vecindad significativa del punto clave

float response : la respuesta mediante la cual se seleccionaron los puntos clave más fuertes. Puede ser utilizado para una mayor clasificación o submuestreo

Pensé que el mejor punto a seguir sería el que obtendría la mayor respuesta, pero parece que no es así. Entonces, ¿cómo podría submuestrear el conjunto de puntos clave devueltos por el detector de surf para mantener solo el mejor en términos de capacidad de seguimiento?


Tamaño y respuesta

SURF es un detector de burbujas, en resumen, el tamaño de una característica es el tamaño de la burbuja. Para ser más precisos, el tamaño devuelto por OpenCV es la mitad de la longitud del operador Hessian aproximado. El tamaño también se conoce como escala, esto se debe a la forma en que funcionan los detectores de manchas, es decir, que es funcionalmente igual a desenfocar primero la imagen con el filtro gaussiano en varias escalas y luego reducir el muestreo de las imágenes y finalmente detectar manchas con un tamaño fijo. Vea la imagen a continuación que muestra el tamaño de las funciones de SURF. El tamaño de cada entidad es el radio del círculo dibujado. Las líneas que salen del centro de las entidades hacia la circunferencia muestran los ángulos u orientaciones. En esta imagen, la fuerza de respuesta del filtro de detección de manchas está codificada por colores. Puede ver que la mayoría de las características detectadas tienen una respuesta débil. (ver la imagen a tamaño completo here )

Este histograma muestra la distribución de las fortalezas de respuesta de las características en la imagen anterior:

¿Qué características seguir?

El rastreador de características más robusto rastrea todas las características detectadas. Cuantas más características tenga más robustez. Pero no es práctico rastrear una gran cantidad de funciones, ya que a menudo queremos limitar el tiempo de cálculo. El número de funciones para realizar el seguimiento a menudo se debe ajustar empíricamente para cada aplicación. A menudo, la imagen se divide en subregiones regulares y en cada una de ellas se guardan las n características más fuertes. Generalmente, se elige n de tal manera que en total se detecten alrededor de 500 ~ 1000 características por fotograma.

Referencias

Leer el periódico que describe SURF definitivamente le dará una buena idea de cómo funciona. Simplemente intente no quedarse atascado en los detalles, especialmente si su fondo no está en la visión de la máquina / computadora o el procesamiento de imágenes. El detector SURF puede parecer extremadamente novedoso a primera vista, pero la idea general es estimar el operador Hessian (un filtro bien establecido) utilizando imágenes integrales (que han sido utilizadas por otros métodos mucho antes que SURF). Si desea comprender muy bien SURF y no está familiarizado con el procesamiento de imágenes, necesita volver y leer material de introducción. Recientemente me encontré con un libro nuevo y gratuito , cuyo capítulo 13 tiene una buena y breve introducción a la detección de características. No todo lo que se dice allí es técnicamente correcto, pero es un buen punto de partida. Here puede encontrar otra buena descripción de SURF con varias imágenes que muestran cómo funciona cada paso. En esa página ves esta imagen:

Puede ver las manchas blancas y negras, estas son las manchas que SURF detecta en varias escalas y estima sus tamaños (radio en el código OpenCV).


  1. "tamaño" es el tamaño del área cubierta por el descriptor en la imagen original (se obtiene mediante un submuestreo de la imagen original en el espacio de escala, por lo que varía de un punto clave a otro en función de su escala).

  2. "respuesta" es, de hecho, un indicador de "cuán bueno" (en términos generales, en términos de esquina), un punto es.

  3. Los puntos buenos son estables para la recuperación de escenas estáticas (este es el propósito principal de los descriptores SIFT / SURF). En el caso del seguimiento, puede tener buenos puntos que aparecen porque el objeto rastreado está en un fondo bien formado, de la mitad en la sombra ... luego desaparece porque esta condición ha cambiado (cambio de luz, oclusión ...). Por lo tanto, no hay garantía para el seguimiento de tareas de que siempre habrá un buen punto.