python - from - Descargar pdf usando urllib?
request url python 3 (2)
Aquí hay un ejemplo que funciona:
import urllib2
def main():
download_file("http://mensenhandel.nl/files/pdftest2.pdf")
def download_file(download_url):
response = urllib2.urlopen(download_url)
file = open("document.pdf", ''w'')
file.write(response.read())
file.close()
print("Completed")
if __name__ == "__main__":
main()
Ha sido probado
Estoy tratando de descargar un archivo pdf de un sitio web usando urllib. Esto es lo que obtuve hasta ahora:
import urllib
def download_file(download_url):
web_file = urllib.urlopen(download_url)
local_file = open(''some_file.pdf'', ''w'')
local_file.write(web_file.read())
web_file.close()
local_file.close()
if __name__ == ''main'':
download_file(''http://www.example.com/some_file.pdf'')
Cuando ejecuto este código, todo lo que obtengo es un archivo pdf vacío. ¿Qué estoy haciendo mal?
Change open(''some_file.pdf'', ''w'')
para open(''some_file.pdf'', ''wb'')
, los archivos pdf son archivos binarios, por lo que necesita la ''b''. Esto es cierto con prácticamente cualquier archivo que no pueda abrir en un editor de texto.