Python: creación de URL
El módulo de solicitudes puede ayudarnos a construir las URL y manipular el valor de la URL de forma dinámica. Cualquier subdirectorio de la URL se puede recuperar mediante programación y luego una parte de ella se puede sustituir por nuevos valores para crear nuevas URL.
Build_URL
El siguiente ejemplo utiliza urljoinpara buscar las diferentes subcarpetas en la ruta de la URL. El método urljoin se utiliza para agregar nuevos valores a la URL base.
from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec
Cuando ejecutamos el programa anterior, obtenemos el siguiente resultado:
https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
Dividir las URL
Las URL también se pueden dividir en muchas partes más allá de la dirección principal. Los parámetros adicionales que se utilizan para una consulta específica o etiquetas adjuntas a la URL se separan mediante el método urlparse como se muestra a continuación.
from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)
Cuando ejecutamos el programa anterior, obtenemos el siguiente resultado:
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')