recognition online google example machine-learning computer-vision image-recognition

machine-learning - example - google vision api online



Reconocimiento de logotipos en imágenes (4)

Podría tratar de usar funciones locales como SIFT aquí: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Debería funcionar porque la forma del logotipo suele ser constante, por lo que las características extraídas deben coincidir bien.

El flujo de trabajo será así:

  1. Detecte las esquinas (p. Ej., Detector de esquina Harris): para el logotipo de Nike, tiene dos extremos afilados.

  2. Calcular descriptores (como SIFT - 128D integer vector)

  3. En la etapa de entrenamiento recordarlos; en la etapa de emparejamiento, encuentre los vecinos más cercanos para cada característica de la base de datos obtenida durante el entrenamiento. Finalmente, tienes un conjunto de coincidencias (algunas de ellas probablemente sean incorrectas).

  4. Elimine las coincidencias incorrectas usando RANSAC. De este modo, obtendrá la matriz que describe la transformación de la imagen del logotipo ideal a una en la que encuentre el logotipo. Dependiendo de la configuración, puede permitir diferentes tipos de transformaciones (solo traducción, traducción y rotación, transformación afín).

El libro de Szeliski tiene un capítulo (4.1) sobre características locales. http://research.microsoft.com/en-us/um/people/szeliski/Book/

PD

  1. Supuse que querías encontrar logotipos en las fotos, por ejemplo, encontrar todas las vallas publicitarias de Pepsi, para que pudieran distorsionarse. Si necesita encontrar el logotipo de un canal de televisión en la pantalla (para que no se gire ni escalar), puede hacerlo más fácilmente (coincidencia de patrones o algo así).

  2. SIFT convencional no tiene en cuenta la información de color. Como los logotipos generalmente tienen colores constantes (aunque el color exacto depende del rayo y la cámara), es posible que desee considerar la información del color de alguna manera.

¿Alguien sabe del trabajo académico reciente que se ha hecho en el reconocimiento de logotipo en imágenes? Responda solo si está familiarizado con este tema específico (puedo buscar en Google "reconocimiento de logotipo", muchas gracias). Cualquier persona que tenga conocimiento de la visión por computador y haya trabajado en el reconocimiento de objetos también puede comentar.

Actualización : Consulte los aspectos algorítmicos (qué enfoque cree que es apropiado, documentos en el campo, si debería funcionar (y ha sido probado) para datos del mundo real, consideraciones de eficiencia) y no los aspectos técnicos (el lenguaje de programación utilizado o ya sea con OpenCV ...) Trabajar en la indexación de imágenes y la recuperación de imágenes basadas en el contenido también puede ayudar.


Trabajé en eso: el registro y la recuperación de marcas registradas en bases de datos de videos deportivos obtuvieron un PDF del artículo: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

Utilizamos SIFT como descriptores de marca e imagen, y una coincidencia de umbral normalizada para calcular la distancia entre modelos e imágenes. En nuestro último trabajo, hemos podido reducir en gran medida el cálculo utilizando metamodelos, creados evaluando la relevancia de los puntos SIFT que están presentes en diferentes versiones de la misma marca.

Diría que, en general, trabajar con videos es más difícil que trabajar en fotografías debido a la muy mala calidad visual de los estándares de TV actualmente utilizados.

Marco


Trabajé en un proyecto donde tuvimos que hacer algo muy similar. Al principio intenté usar las técnicas de entrenamiento de Haar usando este software

OpenCV

Funcionó, pero no era una solución óptima para nuestras necesidades. Nuestras imágenes de origen (donde estábamos buscando el logotipo) tenían un tamaño fijo y solo contenían el logotipo. Debido a esto, pudimos usar cvMatchShapes con una buena coincidencia conocida y comparar el valor devuelto para considerar una buena coincidencia.


Trabajamos en la detección / reconocimiento de logotipos en imágenes del mundo real. También creamos un conjunto de datos FlickrLogos-32 y lo FlickrLogos-32 a disposición del público, incluidos los datos, la verdad sobre el terreno y los scripts de evaluación.

En nuestro trabajo tratamos el reconocimiento de logotipos como un problema de recuperación para simplificar el reconocimiento de clases múltiples y para permitir que dichos sistemas sean fácilmente escalables a muchas (por ejemplo, miles) clases de logotipos.

Recientemente, desarrollamos una técnica de agrupamiento llamada Bundle min-Hashing que agrega configuraciones espaciales de múltiples características locales en paquetes de características altamente distintivos. La representación del paquete se puede usar tanto para la recuperación como para el reconocimiento. Consulte los siguientes mapas de calor de ejemplo para detecciones de logotipos:

Encontrarás más detalles sobre las operaciones internas, las aplicaciones potenciales del enfoque, los experimentos sobre su rendimiento y, por supuesto, también muchas referencias al trabajo relacionado en los documentos [1] [2] .