ocr tesseract seven-segment-display

Detección de texto en la pantalla de siete segmentos mediante Tesseract OCR



seven-segment-display (3)

El problema con el que estoy corriendo es extraer el texto de una imagen y para esto he usado Tesseract v3.02. Las imágenes de muestra de las que tengo que extraer texto están relacionadas con las lecturas del medidor. Algunos de ellos son con fondo de hoja sólida y algunos de ellos tienen pantalla LED. He entrenado el conjunto de datos para el fondo de la hoja sólida y los resultados son de alguna manera efectivos.

El principal problema que tengo ahora es que las imágenes de texto con fondo de LED / LCD no son reconocidas por Tesseract y debido a esto no se genera el conjunto de entrenamiento.

¿Alguien puede guiarme a la dirección correcta sobre cómo usar Tesseract con la pantalla de siete segmentos (fondo de LCD / LED) o hay alguna otra alternativa que pueda usar en lugar de Tesseract?


Echa un vistazo a este proyecto:

https://github.com/arturaugusto/display_ocr

Allí puede descargar los datos entrenados para la fuente de 7 segmentos y un script de Python con algunas capacidades de preprocesamiento.


Esto parece una tarea de preprocesamiento de imágenes. Tesseract realmente preferiría que sus imágenes fueran texto blanco sobre negro en formato de mapa de bits. Si le das algo que no es eso, hará todo lo posible para convertirlo a ese formato. No es muy inteligente sobre cómo hacer esto. Usando alguna herramienta de manipulación de imágenes (me gusta imagemagick), necesitas hacer las imágenes más para la satisfacción de Tesseract. Una primera pasada fácil podría ser hacer un desenfoque gaussiano de radio pequeño, un umbral a un valor bastante bajo (está intentando mantener solo el negro, por lo que el 15% parece correcto), y luego invertir la imagen.

La parte difícil se convierte entonces en saber qué tarea de preprocesamiento hacer. Si tiene metadatos que le dicen con qué tipo de pantalla está tratando, genial. Si no es así, sospecho que podría mirar los histogramas de color de la imagen para al menos averiguar si el texto es blanco sobre negro o negro sobre color. Si estos son los únicos escenarios, el blanco sobre negro siempre es un fondo sólido, y el negro sobre color es siempre una pantalla de siete segmentos, entonces ya está. Si no, tendrás que ser listo. Buena suerte, y por favor háganos saber lo que se le ocurre.