read from python pdf urllib

python - from - Descargar pdf usando urllib?



request url python 3 (2)

Aquí hay un ejemplo que funciona:

import urllib2 def main(): download_file("http://mensenhandel.nl/files/pdftest2.pdf") def download_file(download_url): response = urllib2.urlopen(download_url) file = open("document.pdf", ''w'') file.write(response.read()) file.close() print("Completed") if __name__ == "__main__": main()

Ha sido probado

Estoy tratando de descargar un archivo pdf de un sitio web usando urllib. Esto es lo que obtuve hasta ahora:

import urllib def download_file(download_url): web_file = urllib.urlopen(download_url) local_file = open(''some_file.pdf'', ''w'') local_file.write(web_file.read()) web_file.close() local_file.close() if __name__ == ''main'': download_file(''http://www.example.com/some_file.pdf'')

Cuando ejecuto este código, todo lo que obtengo es un archivo pdf vacío. ¿Qué estoy haciendo mal?


Change open(''some_file.pdf'', ''w'') para open(''some_file.pdf'', ''wb'') , los archivos pdf son archivos binarios, por lo que necesita la ''b''. Esto es cierto con prácticamente cualquier archivo que no pueda abrir en un editor de texto.