tutorial pytesseract ocr tesseract feature-extraction

pytesseract - ¿Qué motor de OCR es mejor: Tesseract u OCRopus?



tesseract ocr tutorial (2)

También puede consultar la actividad de los proyectos en el enlace "cambios".

https://code.google.com/p/ocropus/source/list?repo=ocropy

https://code.google.com/p/tesseract-ocr/source/list

Tesseract está mucho más ocupado

He probado Tesseract con iPhone y he evaluado que su precisión es del 70% sin el preprocesamiento de imágenes. También me di cuenta de que podría ser pobre en la extracción de dígitos. He oído hablar del motor OCRopus OCR: ¿cuál es mejor, Tesseract u OCRopus, en términos de extracción de dígitos y si el preprocesamiento de mi imagen es bajo?
¿Alguien ha realizado pruebas utilizando ambos motores comparando los resultados utilizando las métricas habituales?


Inicialmente, OCRopus estaba usando Tesseract como motor de reconocimiento en su interior, pero luego lo cambiaron por su propio motor nuevo. Todavía es fresco y no está maduro. Hemos estado haciendo una comparación de precisión hace un año, y OCRopus definitivamente estaba perdiendo a Tesseract, ni siquiera estoy hablando de enignes comerciales. Desde entonces dejé de seguir el progreso de OCRopus, pero lo que definitivamente sé es que la actividad en el foro de soporte de OCRopus es casi nula ahora. Eso significa, nadie lo está usando. La mayoría de las personas utilizan motores comerciales, pero si el precio es un problema para ellos y pueden tolerar una menor precisión, entonces usan Tesseract. Definitivamente es el mejor entre Open Source.