una tipografia online letra imagen identificar historia gratis google fuentes fuente detector dafont fonts ocr tesseract

fonts - online - tipografia ocr a



¿Cuál es la fuente ideal para OCR? (7)

Bien, una búsqueda en google viene con esto, una fuente OCR específica: Fuente OCR

Parece que es un estándar adoptado en 1973.

¿Alguien tiene alguna experiencia con diferentes fuentes para OCR? Estoy generando una identificación y luego intento escanearla con tesseract. Por el momento solo soy T & E en fuentes diferentes, pero parece bastante ineficiente. He probado la familia de fuentes OCR * y varias otras como Arial y Georgia. El tesseract tiende a confundirse con las fuentes OCR *.

¿Hay alguna fuente diseñada específicamente para tesseract o cualquier fuente de sistema que funcione bien con ella?


Probablemente usaría la misma fuente que usan los bancos para los números de ruta en la parte inferior de los cheques:

http://morovia.com/font/micr.asp

Fue diseñado específicamente para ser legible por máquina de forma inequívoca.


Siempre tuve éxito simplemente usando tiempos nuevos romanos.


Me parece que Calibri funciona mejor para mí. Usamos el software OCR diariamente en un sistema automatizado y después de probar docenas de fuentes (incluidas algunas específicas de OCR) que Calibri es consistentemente el mejor.

Buena suerte.


Actualmente usando Monospace. Intenté muchas fuentes, pero esta es la más precisa para mí.


Después de probar muchas fuentes diferentes y motores de OCR, suelo obtener los mejores resultados usando Consolas . Es un tipo de letra monospaciado como OCR-A, pero más fácil de leer para los humanos. Consolas está incluido en varios productos de Microsoft.

También hay una fuente de fuente abierta Inconsolata , que está influenciada por Consolas. Inconsolata es un buen reemplazo para Consolas, especialmente teniendo en cuenta los detalles de la licencia.

En mis pruebas, los números y espacios en la fuente Calibri no siempre se reconocieron correctamente. OCR-A dio muchos errores de lectura. No le di una oportunidad a MIRC, ya que no es fácil de leer para la mayoría de los humanos.

Nota : tesseract requiere una gran cantidad de pruebas y ajustes antes de ser confiable. En nuestro caso, cambiamos a un motor de OCR con licencia comercial (ABBYY), especialmente dado que la confiabilidad era muy importante y teníamos que admitir varios idiomas (europeos).

Actualización: 2017 31 de enero - Se cambió '' basado en Consolas '' a '' influenciado por Consolas '' debido a posibles problemas de derechos de autor.


He estado haciendo extensas pruebas en este recientemente en un ECM llamado Laserfiche, que usa Nuance OmniPage, y he encontrado que las fuentes monoespaciales funcionan mal en comparación con las fuentes dinámicamente espaciadas. Esas viejas fuentes de OCR no funcionan tan bien como las fuentes de aspecto más "normal". Especialmente para cadenas de números en tamaños de fuente más pequeños como el punto 12.

Es extraño que alguien más tenga éxito con Calibri. Tuve muy mal rendimiento en mis pruebas, obteniendo rutinariamente letras y números similares confundidos el uno con el otro. Las mejores fuentes (entre las que vienen en una computadora con Windows instalada) fueron Consolas, Verdana y Book Antiqua. Todas las fuentes dinámicas serif donde las letras y los números se veían distintos. Consolas fue el campeón.