reconocimiento - tesseract ocr c# examples
¿Puede Windows ocr reconocer símbolos/fuentes personalizados? (2)
Creo que una respuesta corta a tu pregunta es no. Como se dice en las secciones Idiomas admitidos en el espacio de nombres Windows.Media.Ocr :
Hay 25 idiomas compatibles. Con base en la precisión y el rendimiento del reconocimiento, los idiomas admitidos se dividen en tres grupos:
- Excelente: checo, danés, holandés, inglés, finlandés, francés, alemán, húngaro, italiano, noruego, polaco, portugués, rumano, serbio cirílico, serbio, eslovaco, español y sueco.
- Muy bien: chino simplificado, griego, japonés, ruso y turco.
- Bueno: chino tradicional y coreano.
El idioma es información requerida para el reconocimiento de texto correcto. Cada idioma utiliza algunos recursos específicos del idioma, por lo que debe especificarse de antemano.
Nota Solo se pueden usar idiomas instalados en el dispositivo. Un usuario puede instalar nuevos idiomas a través de la aplicación de Configuración .
Entonces, si sus símbolos no son para ningún idioma, el motor de OCR no lo reconocerá.
Y para la fuente personalizada, como muestra la respuesta de Vineet Choudhary, tal vez el motor de OCR puede reconocer algo, la precisión del reconocimiento de texto depende de su fuente. Si es texto manuscrito o cursivo, la precisión del reconocimiento de texto puede ser muy baja.
Estoy desarrollando para UWP, Windows tiene un motor de OCR: Windows.Media.Ocr
Mi pregunta es: ¿alguien sabe si el OCR de Windows se puede entrenar para reconocer nuevos caracteres o usar una fuente personalizada? si es así, ¿cómo puedo hacer esto?
lo que quiero lograr es reconocer símbolos no alfabéticos. Quiero reconocer por ejemplo el carácter ⌰ (Unicode: U + 2330) o ⌖ (U + 2316).
Los personajes que quiero reconocer son símbolos no para ningún idioma.
Utilicé la biblioteca Windows.Media.Ocr
en mi aplicación WUP y aquí algunos resultados de prueba con diferente fuente
Arial
Fuente - Arial
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello @ World
Precisión - 100%
Agencia FB
Fuente - Agencia FB
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello World
Exactitud : 84.6% (Perdido - @ símbolo y un espacio)
Moderno
Fuente - Moderno
Palabras de prueba - Hello @ World
Resultado esperado - Hello @ World
Resultado original - Hello @ world
Precisión : 92.3% (W reconocido como w)
Escritura Lucida
Font - Lucida Handwriting Test Words - Hola @ Mundo
Resultado esperado - Hello @ World
Resultado original - HeEL @ @ worw
Precisión - 46.1%
Actualización [ 1 ]
Arial Unicode MS
Fuente - Arial Unicode MS
Símbolos de prueba - ⌰ ⌖
Resultado esperado - ⌰ ⌖
Resultado original - (no se puede reconocer)
Precisión - 0%
Actualización 2
Espero que esto sea útil para ti.