ios - saber - Pantalla de 7 segmentos OCR

display de 7 segmentos pdf (2)

Estoy construyendo una aplicación de iOS (tomar una foto y ejecutar OCR en ella) usando Tesseract (una biblioteca de OCR) y está funcionando muy bien con números bien escritos y caracteres (usando fuentes habituales).

El problema que tengo es que si lo pruebo en una pantalla de 7 segmentos, da muy, muy malos resultados.

Entonces mi pregunta es: ¿Alguien sabe cómo puedo abordar este problema? ¿Hay alguna manera de que Tesseract reconozca a estos personajes?

No he intentado OCR con la pantalla de 7 segmentos, pero sospecho que el problema puede deberse a que los caracteres no están conectados a los componentes. Tesseract no maneja bien las fuentes desconectadas de mi experiencia.

La erosión simple (preprocesamiento de imágenes) podría ayudar conectando segmentos, pero tendría que probarlo y jugar con el tamaño del núcleo para evitar demasiada distorsión.

Yo también tuve una gran dificultad para lograr que Tesseract reconozca los dígitos de las imágenes de las pantallas LCD.

Tuve un éxito marginal al preprocesar las imágenes con ImageMagick para superponer una copia de la imagen en sí misma con un ligero desplazamiento vertical para completar las brechas entre los segmentos:

$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png

Al final, sin embargo, mi salvación fue el binario " Reconocimiento de caracteres ópticos de siete segmentos ": http://www.unix-ag.uni-kl.de/~auerswal/ssocr/

¡Muchas gracias al autor, Erik Auerswald, por este código!