python - tesseractnotfounderror - tesseract is not installed or it''s not in your path
Error Tesseract no encontrado (12)
Estoy tratando de usar pytesseract en python pero siempre termino con el error:
"TesseractNotFoundError: tesseract no está instalado o no está en su ruta"
pytesseract y tesseract están instalados en el sistema. Soy nuevo en Python, así que realmente apreciaré si alguien me puede ayudar con esto.
Actualmente estoy usando Windows y necesité desarrollar un analizador de PDF, pero agregar una nueva variable de entorno a través de sysdm.cpl
solo no funcionó. Para otros usuarios de Windows, sugiero encarecidamente agregar C:/Program Files (x86)/Tesseract-OCR
a su profile.ps1
también (si usa Powershell).
Estas importando
from tesseract import image_to_string
No importar desde pytesseract
Instale tesseract desde https://github.com/UB-Mannheim/tesseract/wiki y agregue la ruta de acceso de tesseract.exe a la variable de entorno Path .
Intenté agregar a la variable de ruta como otros han mencionado, pero aún así recibí el mismo error. Lo que funcionó fue agregar esto a mi guión:
pytesseract.pytesseract.tesseract_cmd = r "C: / Archivos de programa (x86) / Tesseract-OCR / tesseract.exe"
Me enfrenté al mismo problema. Espero que hayas instalado desde https://github.com/UB-Mannheim/tesseract/wiki y también hayas hecho la instalación de pip pytesseract.
Si todo está bien, debería ver la ruta C: / Archivos de programa (x86) / Tesseract-OCR donde está disponible tesseract.exe.
La adición de la variable Ruta no me ayudó, en realidad agregué una nueva variable con el nombre tesseract en las variables de entorno con el valor C: / Archivos de programa (x86) / Tesseract-OCR / tesseract.exe
Ahora abra la ventana de comandos y simplemente escriba tesseract, debería funcionar y darle información de uso.
Simplemente importe pytesseract y esta línea debería funcionar para que lea la cadena de texto
text = pytesseract.image_to_string (im, config = config)
¡disfrutar!
Me enfrento a este mismo problema. Solo uso este comando que me ayudará.
sudo apt install tesseract-ocr
Me estoy ejecutando en un sistema operativo Mac e instalé tesseract con brew así que aquí tengo mi opinión sobre esto. Ya que pytesseract es solo la forma en que puede acceder a tesseract desde python, debe especificar dónde tesseract ya está en su computadora.
Para Mac OS
Intente encontrar dónde está el tesseract.exe: si lo instaló utilizando brew , en su terminal use:
>brew list tesseract
Esto debería indicar dónde está su tesseract.exe, en algún lugar más o menos como
> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract
Luego siguiendo sus instrucciones :
pytesseract.pytesseract.tesseract_cmd = r''<full_path_to_your_tesseract_executable>''
pytesseract.pytesseract.tesseract_cmd = r ''/ usr / local / Cellar / tesseract / 3.05.02 / bin / tesseract''
Debería hacer el truco!
Pequeño error: sabía que tenía que abrir / cerrar mi cmd para obtener la ruta actualizada para reflejar. Usando Jupyter Notebook tuve que cerrar el cliente y reiniciarlo también.
Probablemente te esté faltando tesseract-ocr
de tu máquina. Consulte las instrucciones de instalación aquí: https://github.com/tesseract-ocr/tesseract/wiki
En una Mac, puedes instalar usando homebrew:
brew install tesseract
Debería funcionar bien después de eso
Puede descargar la configuración de tesseract-ocr usando el siguiente enlace,
Luego agregue una nueva variable con el nombre tesseract en las variables de entorno con el valor C: / Archivos de programa (x86) / Tesseract-OCR / tesseract.exe
También estaba enfrentando el mismo problema, solo agregue C:/Program Files (x86)/Tesseract-OCR
a su variable de ruta. Si aún no funciona, agregue C:/Program Files (x86)/Tesseract-OCR/tessdata
a su variable de ruta en una nueva línea. Y no olvide reiniciar su computadora después de agregar la variable de ruta.
Recibí este error porque instalé pytesseract
con pip
pero olvidé instalarlo con apt
. En esta situación instálalo con estos comandos:
sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev