source reconocimiento imagenes examples codeproject code c# uwp windows-phone win-universal-app ocr

reconocimiento - tesseract ocr c# examples



¿Puede Windows ocr reconocer símbolos/fuentes personalizados? (2)

Creo que una respuesta corta a tu pregunta es no. Como se dice en las secciones Idiomas admitidos en el espacio de nombres Windows.Media.Ocr :

Hay 25 idiomas compatibles. Con base en la precisión y el rendimiento del reconocimiento, los idiomas admitidos se dividen en tres grupos:

  • Excelente: checo, danés, holandés, inglés, finlandés, francés, alemán, húngaro, italiano, noruego, polaco, portugués, rumano, serbio cirílico, serbio, eslovaco, español y sueco.
  • Muy bien: chino simplificado, griego, japonés, ruso y turco.
  • Bueno: chino tradicional y coreano.

El idioma es información requerida para el reconocimiento de texto correcto. Cada idioma utiliza algunos recursos específicos del idioma, por lo que debe especificarse de antemano.

Nota Solo se pueden usar idiomas instalados en el dispositivo. Un usuario puede instalar nuevos idiomas a través de la aplicación de Configuración .

Entonces, si sus símbolos no son para ningún idioma, el motor de OCR no lo reconocerá.

Y para la fuente personalizada, como muestra la respuesta de Vineet Choudhary, tal vez el motor de OCR puede reconocer algo, la precisión del reconocimiento de texto depende de su fuente. Si es texto manuscrito o cursivo, la precisión del reconocimiento de texto puede ser muy baja.

Estoy desarrollando para UWP, Windows tiene un motor de OCR: Windows.Media.Ocr

Mi pregunta es: ¿alguien sabe si el OCR de Windows se puede entrenar para reconocer nuevos caracteres o usar una fuente personalizada? si es así, ¿cómo puedo hacer esto?

lo que quiero lograr es reconocer símbolos no alfabéticos. Quiero reconocer por ejemplo el carácter ⌰ (Unicode: U + 2330) o ⌖ (U + 2316).

Los personajes que quiero reconocer son símbolos no para ningún idioma.


Utilicé la biblioteca Windows.Media.Ocr en mi aplicación WUP y aquí algunos resultados de prueba con diferente fuente

Arial

Fuente - Arial
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello @ World
Precisión - 100%

Agencia FB

Fuente - Agencia FB
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello World
Exactitud : 84.6% (Perdido - @ símbolo y un espacio)

Moderno

Fuente - Moderno
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello @ world
Precisión : 92.3% (W reconocido como w)

Escritura Lucida

Font - Lucida Handwriting Test Words - Hola @ Mundo
Resultado esperado - Hello @ World
Resultado original - HeEL @ @ worw
Precisión - 46.1%

Actualización [ 1 ]

Arial Unicode MS

Fuente - Arial Unicode MS
Símbolos de prueba - ⌰ ⌖
Resultado esperado - ⌰ ⌖
Resultado original - (no se puede reconocer)
Precisión - 0%

Actualización 2

Espero que esto sea útil para ti.