una tomar samsung pantalla one htc hacer computadora como celular captura fonts ocr tesseract pattern-recognition

fonts - samsung - como tomar captura de pantalla en computadora



¿La mejor manera de reconocer personajes en captura de pantalla? (4)

¿Qué recomendarías para reconocer a todos los personajes de una captura de pantalla? La captura de pantalla es perfectamente clara (solo texto negro sobre un fondo blanco), también puedo elegir cualquier fuente de estrella para el texto (instalado en Windows). He intentado algunas formas de OCR (Tesseract y similares), pero cometí errores al reconocer algunos caracteres (eso me desconcertó, ya que el texto es sin el menor ruido y las fuentes eran algunas de las más comunes: Courier New, Fixedsys, etc.) Y lo necesito 100% preciso. ¿Hay alguna biblioteca disponible para este propósito específico, algún reconocimiento de patrones o algo? ¿o debería obtener la captura de pantalla con alguna fuente monoespaciada, e iterar a través de la imagen moviéndose hacia la derecha + tamaño de fuente de píxeles y luego comparar la cosa capturada con la representación de letras en la memoria y el número de la misma fuente en el mismo tamaño? ¿Cuál sería el mejor enfoque para este problema? Muchas gracias por adelantado.

ACTUALIZACIÓN: finalmente logré obtener el 100% de precisión al entrenar Tesseract con fuente monoespaciada (Courier New) en el tamaño exacto en el que estoy capturando. Espero que ayude a alguien en el futuro :)


¿Tiene la opción de cambiar el suavizado de texto en el nivel del sistema operativo? Jugar con esas configuraciones (o incluso intentar desactivarlo) también puede darte un mejor resultado con los OCR existentes.


Me sorprendería que OCR diera tan malos resultados en una entrada de tan buena calidad. Probablemente lo que quiera hacer es elegir una fuente que tenga bordes afilados, sin suavizado, un tamaño de fuente más grande también ayudaría.

Además, si es aceptable, pruebe la fuente OCR dada en esta pregunta SO:

Esto debería darte los mejores resultados posibles: si esto no va al 100%, entonces no sé qué harás ...

No sé qué probaste al lado de Tesseract, pero si no lo hiciste, podría valer la pena probar otros. Estos parecen haber sido actualizados recientemente (Tesseract fue actualizado hace un año):

También hay algunas versiones en línea, como:

que puede utilizar para probar un documento de muestra. Desde este enlace:

Parece que es posible que necesites hacer un comercial para obtener lo que quieres.

Espero que esto ayude.


Sé que ya resolvió su problema, pero en caso de que esto ayude a alguien más: dos problemas que encontré al tratar con capturas de pantalla es que los motores de OCR son sensibles a lo siguiente: (1) la resolución está configurada incorrectamente en los encabezados de los archivos de imagen y (2) la transparencia Problemas (lo que parece un fondo blanco en realidad está marcado como transparente). Por alguna razón, estos problemas tienden a ocurrir con frecuencia en las imágenes de captura de pantalla.

Además, aparte de Tesseract, otra posibilidad es probar la API en http://www.wisetrend.com/wisetrend_ocr_cloud.shtml basada en el motor ABBYY OCR. (La ventaja es que no hay nada que instalar / configurar / etc para intentarlo para asegurarse de que funcionará en sus imágenes, solo haga un POST HTTP). Descargo de responsabilidad: WiseTrend es el cliente de mi empresa.


Ya que este es el primer resultado en Google para la tesseract recognize screenshot , permítame hacer un poco de nigromancia y agregar una solución mucho más simple.

Tesseract espera que las imágenes tengan aproximadamente 300 ppp o más, y el estándar para Windows es de 96. Lo que significa que debe volver a escalar la imagen al 300%. Después de eso, los resultados mejoran dramáticamente.

100%

Resultado: ¿ Whal would you recommend for recognizing all characters from a screensnor 7

200%

Resultado: What would you recommend for recognizing all chamcters from a screenth ?

300%

Resultado: What would you recommend for recognizing all characters from a screenshot ?

Cualquier cosa por encima del 300% funciona igual de bien.