image processing - seguimiento - ¿Dónde comienzo a aprender sobre el procesamiento de imágenes y el reconocimiento de objetos?

seguimiento y deteccion de objetos por color y forma con opencv (7)

Bienvenido al mundo divertido de la visión artificial, que básicamente es el campo de procesamiento de imágenes con algoritmos de IA para hacer reconocimiento / seguimiento / segmentación, etc. Sin ser exhaustivo, todo el proceso implica adquisición de imágenes, procesamiento de imágenes, segmentación de imágenes, reconocimiento de imágenes .

La forma más fácil de comenzar es probablemente OpenCV. Sin embargo, en la mayoría de las aplicaciones, usar OpenCV es probablemente exagerado, ya que realmente no es tan difícil comenzar de cero. Una vez que haya pasado la carga de la imagen (probablemente desee considerar BMP como es más fácil de analizar), puede implementar muchos algoritmos básicos de procesamiento de imágenes si solo tiene la fórmula matemática. También hay otra biblioteca que probablemente puedas probar, cosas como torchvision, AForge (.NET) son buenas opciones.

Cuando se trata de la parte AI, aquí es donde las cosas se vuelven interesantes. Es probable que desee utilizar SVM donde hay una gran cantidad de biblioteca que puede utilizar, por ejemplo, libsvm, SVMlight y etc.

Estoy interesado en escribir alguna aplicación de reconocimiento de objetos computarizada básica, así que creo que necesito algunos antecedentes teóricos en algoritmos de procesamiento de imágenes, junto con algunos AI para la toma de decisiones.

Soy un graduado en ciencias de la computación, y un día planeo obtener mi maestría, con suerte en uno de estos campos. Mientras tanto, me gustaría tener una ventaja y hacer algo de autoaprendizaje.

Entonces mi pregunta es, ¿por dónde empiezo? Apreciaría una flecha en la dirección correcta, algunos enlaces si es posible.

Buenas respuestas Espero que no seas matemático-fóbico. Mi técnica favorita en estos días es Markov-Chain Monte Carlo (Google Spiegelhalter). El reconocimiento es un problema de optimización, y MCMC es una forma general de manejarlos a través de la inferencia bayesiana.

Es posible que desee verificar las respuestas a estas preguntas similares:

Lenguaje / entorno de procesamiento de imágenes

He escrito algunos tutoriales de visión artificial y procesamiento de imágenes OpenCV con código fuente gratuito, por lo que es posible que desee consultar algunos de ellos para comenzar: http://www.shervinemami.co.cc/openCV.html

Recientemente, Microsoft lanzó un SDK de .NET de código abierto implementado en C # y C ++ con algunas interfaces de cámara muy rudimentarias y análisis de imágenes. Vale la pena echar un vistazo al código extremadamente bien documentado para seguir adelante.

Si le interesan los libros, le recomendaría "Introducción al procesamiento y análisis de imágenes" de John Russ a nivel introductorio. También utilicé ImageJ como una buena aplicación gratuita de análisis de imágenes, buena para crear prototipos y probar cosas. Como otros han dicho, la biblioteca de OpenCV vale la pena mirarla también.

Tal vez eche un vistazo a: OpenCV . Una biblioteca realmente buena para el procesamiento de imágenes, y cuando sabrá qué usar para qué propósito, puede echar un vistazo ''debajo del capó'' para saber cómo funciona :)