una texto software online imagen google extraer escaneado copiar convertir convertidor objective-c cocoa ios4

objective-c - texto - pdf a excel ocr



OCR(lectura de texto de fotos) en Cocoa? (1)

¿Hay algún código por ahí, que pueda usar en Cocoa, para reconocer el texto de las fotos? Digamos que hago una foto con mi iPhone de una página de un libro. Me gustaría capturar el texto en él.


Existe el kit de herramientas de OCR Tesseract que es un motor de OCR de código abierto, actualmente mantenido por Google. "Olipion" creó un tutorial de compilación cruzada para entrar en el iPhone. Yo diría que este es un buen lugar para comenzar.

Sin embargo, hay razones por las que es posible que no desee utilizar el OCR en el teléfono, incluso si pudiera. Algunos de estos incluyen:

  • Incluso el procesador del nuevo iPhone 4 no es tan rápido y, dado que su aplicación no puede ejecutarse en segundo plano haciendo el procesamiento, la experiencia del usuario podría no ser óptima.
  • Ejecutar OCR en un dispositivo móvil probablemente sea un asesino para la duración de la batería.
  • Cada vez que desee actualizar el motor de OCR, todos los que instalaron su aplicación tendrían que actualizar.

Para un dispositivo móvil siempre conectado ejecutar el OCR en un servidor en alguna parte sería probablemente mejor. Podría actualizar fácilmente su software de OCR, podría ejecutar algoritmos mucho más potentes que los que podría manejar un dispositivo móvil, etc.

No estoy tan seguro de que pueda obtener buenos resultados de las fotos tomadas con una cámara móvil: la precisión de los sistemas de OCR disminuye con el tipo de imágenes mal iluminadas, ruidosas y distorsionadas que probablemente se capten con la cámara de un teléfono.

En cuanto a productos comerciales, existe Evernote que le otorga una capacidad de OCR si compra su servicio premium.

Como alternativa a la máquina de OCR, siempre hay Mechanical Turk , donde puede pagarle a la gente una pequeña cantidad para que le haga el OCR. Probablemente sea mejor en la transcripción dada la fuente de la imagen.