source software open ocropus image-processing nlp ocr arabic

image-processing - software - ocropus ocr



Open-source OCR library for Arabic (3)

No sé nada sobre la calidad árabe de OCR, pero algunos Google inteligentes encontraron el lector automático de Sakhr . Es un software comercial.

Lo siento. Es comercial y bastante caro. El árabe es probablemente uno de los idiomas más difíciles del mundo para hacer OCR, creo que se necesita mucho para motivar a alguien a hacerlo.

Estaba buscando una biblioteca de OCR (de manera óptima, sería de código abierto) que podría usar en algunos archivos PDF árabes. Buscar en Google no resultó en nada útil. Me preguntaba si alguien conoce una biblioteca de OCR relacionada o incluso una que funcione en idiomas relacionados (Farsi y Urdu podrían ser relevantes) a los que se podría agregar soporte en árabe.

Cualquier sugerencia general sobre cómo abordar esto será apreciada.


A partir de la versión 3.01 de Tessaract-ocr ahora es compatible con árabe


El idioma árabe es sofisticado cuando se trata de OCR debido a la naturaleza del idioma y no hay software gratuito o comercial que pueda obtener el 100% de precisión.

Esto es por mi experiencia personal, pero puedes probar IRISREadIRIS pro 14.