software reconocimiento programa optico online i2ocr gratis google escaneado editable convertir best ocr

reconocimiento - ocr software



OCR lib para fórmulas matemáticas (9)

Dado que la salida del OCR matemático para fórmulas complejas probablemente tendrá errores (incluso los humanos tienen problemas con él), tendrá que revisar los resultados, al menos si son importantes. El corrector de pruebas (humano) tendrá que corregir los resultados, lo que significa que debe tener un editor de fórmulas matemáticas. Dado el esfuerzo que necesitan los humanos, el cuerpo limitado de fórmulas complejas, probablemente le resulte más fácil asignar la tarea a los humanos.

Como un problema de investigación, leer matemáticas a través de OCR es divertido, necesitas un formalismo para las gramáticas en 2-D además de un reconocedor de símbolos.
Además de las referencias ya mencionadas aquí, ¿por qué no buscar en Google para esto? Hay trabajos que se realizaron en Caltech, Rochester, U. Waterloo y UC Berkeley. ¿Cuánto de eso está listo para usar fuera de la caja? No sé.

Necesito una biblioteca abierta de OCR que pueda escanear fórmulas matemáticas complejas impresas (por ejemplo, algunas fórmulas que se generaron a través de LaTeX). Quiero obtener una salida similar a LaTeX (o solo algunos datos similares a AST).

¿Hay algo como esto ya? ¿O son las técnicas actuales de OCR simplemente capaces de analizar texto orientado a líneas?

(Tenga en cuenta que también publiqué esta pregunta en Metaoptimize porque algunas personas podrían tener conocimiento adicional).

El problema también fue descrito por OpenAI como im2latex .



Echa un vistazo a " Ecuación Web ". Puede convertir ecuaciones escritas a mano a LaTeX, MathML o SymbolTree. No estoy seguro si el motor es de código abierto.


Infty funciona bastante bien. Mi antigua empresa lo integró en una aplicación que lee ecuaciones en voz alta para personas ciegas y está recibiendo buenos comentarios de los usuarios.

InftyProject


InftyReader es el único que conozco. NO es software libre (parece que el dinero va a una organización sin fines de lucro, IIRC).

http://www.sciaccess.net/en/InftyReader/

No sé por qué PDF no puede tener metadatos en LaTeX? Como en: ¡pon la ecuación de LaTeX en ella! ¿Es esto tan difícil? (No sé nada acerca de la sintaxis de PDF, pero me imagino que se puede hacer).

La sintaxis de LaTeX es EL ÚNICO TRIADO Y VERDADERO ESTÁNDAR para la notación matemática. Parece increíblemente estúpido que las personas que produjeron MathML y ​​otras cosas no tomen esto en consideración. InftyReader genera sintaxis MathML o LaTeX.

Si quiero HTML (puro), uso TTH para leer la sintaxis de LaTeX. Solo funciona

ABBYY FineReader (un excelente programa de OCR) dice que puedes entrenar el software para Matemáticas, pero esto es inmensamente inteligente (¿quién tiene tiempo?

Y Unicode tiene muchos símbolos matemáticos. Que los lectores de OCR de hoy no puedan asimilarlos muestra el lamentable estado del software y el déficit cerebral en esta actividad.

En cuanto a "un símbolo a la vez", TeX obviamente tiene reglas sobre dónde colocar los símbolos. ¿No pueden escribir software que conozcan esas reglas? TeX es incluso de dominio público! Simplemente pueden "usarlo" en sus productos comerciales.


SESHAT es un sistema de código abierto escrito en C ++ para reconocer expresiones matemáticas escritas a mano. SESHAT se desarrolló como parte de una tesis doctoral en el centro de investigación PRHLT de la Universitat Politècnica de València.

Una demostración en línea: http://cat.prhlt.upv.es/mer/

La fuente: https://github.com/falvaro/seshat

Seshat es un sistema de código abierto para reconocer expresiones matemáticas escritas a mano. Dada una muestra representada como una secuencia de trazos, el analizador puede convertirlo a LaTeX u otros formatos como InkML o MathML.



Ya sabes, hay una aplicación en Win7 solo para eso: Math Input Panel . Incluso maneja la entrada manuscrita (en realidad está hecha para esto). Dale una oportunidad si tienes Win7, ¡es gratis!


hay un gran video corto: http://www.youtube.com/watch?v=LAJm3J36tLQ explicando cómo puedes entrenar a tu Fine Reader para que reconozca fórmulas matemáticas. Si ya usa Fine Reader, es mejor quedarse con una herramienta. Por supuesto no es freeware :(