pytesseract instalar image_to_string windows opencv visual-studio-2012 tesseract

instalar - Tesseract+opencv 3.0+windows, módulo de texto de pequeño tamaño, errores de enlace



tesseract ocr python ubuntu (1)

Publiqué este texto hace dos días en answers.opencv.org, ahora lo estoy publicando aquí también. http://answers.opencv.org/question/68634/text-contrib-module-and-tesseract/

Buenas tardes a todos. En primer lugar, perdón por mi inglés jeje. He intentado construir el ''texto'' del módulo contrib de opencv, pero no he tenido éxito. Nota: Otros módulos como xfeatures2d nunca me han dado un problema.

Mi plataforma es Windows 7 x64 y utilizo VS2013 como compilador, he seguido este tutorial ( http://vorba.ch/2014/tesseract-3.03-vs2013.html ) para construir Tesseract 3.04 como LIB, pero después de compilar Con éxito, quiero generar el vproj con cmake y el problema es el siguiente:

En la GUI de CMake, habiendo seleccionado previamente la fuente de opencv, el directorio de EXTRAS, etc., no obtengo correctamente los vars en el grupo de ''Tesseract'' (INCLUDE E LIBS). Lo sé porque cuando hago clic en configurar, el registro dice "Tesseract: NO".

He inspeccionado el script cmake FindTesseract y creo que no funciona ...

Por favor, ¿alguien podría darme una pequeña pista sobre lo que está pasando? ¿Cómo puedo construir el módulo de texto opencv para usar las funciones de Tesseract?

También intenté compilar el módulo de texto agregando rutas de enlace a Tesseract, pero cuando quiero usarlo en mi programa obtengo errores de enlace sobre símbolos indefinidos ...

Esta situación me está llevando varios días molestándome. ¿Hay alguien que está utilizando el módulo de texto en Windows?

Nadie puede ayudarme? He progresado un poco, ahora hago una GUI, me dice Tesseract: sí. El problema era que no había encontrado la entrada para vincular la lib de Leptonica, que no está en el mismo grupo Tesseract sino en ''Entradas no agrupadas''.

Ok, ahora el problema sigue siendo el mismo, la solución VS creada por cmake no está construyendo el módulo de texto correctamente, como puedo ver Lept lib es de aproximadamente 9Mb y TesseractLib es de 128Mb (en / MT y depuración), sin embargo, el opencv_text300d.lib solo tiene 12Mb . Algo está mal....

No estoy seguro de qué versión de tesseract debo usar. He traid con dos combinaciones: liblept168-static-mtdll-debug.lib + libtesseract302-static-debug.lib y liblept171-static-mtdll-debug.lib + libtesseract304-static-debug.lib

Por supuesto, cuando enlace el módulo de texto a mi programa, me da errores de enlace.

Los errores de enlace se parecen a: opencv_text300d.lib (ocr_tesseract.obj): error LNK2019: unresolved external symbol "public: bool __cdecl tesseract::PageIterator::BoundingBox(enum tesseract::PageIteratorLevel,int *,int *,int *,int *)const " (?........................

... #include "opencv2/text.hpp" ... string output; cv::Mat aux; Ptr<OCRTesseract> ocr = OCRTesseract::create(); ocr->run(aux, output); ...

Obviamente, he configurado mi proyecto con directorios de inclusión adicionales, un directorio adicional de bibliotecas de enlaces y entradas de dependencias adicionales al módulo de texto.

Realmente, muchas gracias en avanzado.


Estaba enfrentando el mismo problema. La solución que se me ocurrió fue editar el archivo CMakeLists.txt en el módulo de texto.

Reemplazar

if(${Tesseract_FOUND}) include_directories(${Tesseract_INCLUDE_DIR}) endif()

con

add_definitions( -DWINDOWS) add_definitions( -DNOMINMAX) SET(Tesseract_DIR "C://tesseract-build//tesseract-ocr") SET(Lept_DIR "C://tesseract-build//lib") include_directories( ${Tesseract_DIR}/api ${Tesseract_DIR}/ccutil/ ${Tesseract_DIR}/ccstruct/ ${Tesseract_DIR}/ccmain/ ) link_directories( ${Tesseract_DIR}/vs2013/bin/Win32/DLL_Release/ ${Lept_DIR}/ ${Lept_DIR}/Win32/ )

Cuando ejecuta Cmake, Tesseract seguirá siendo no y las bibliotecas de Tessaract / Lept deberían estar vacías.