python - unquote - urllib parse download
¿Qué debería estar utilizando: urlparse o urlsplit? (2)
Directamente desde urlsplit :
urllib.parse.urlsplit(urlstring, scheme='''', allow_fragments=True)
Esto es similar aurlparse(), pero no divide los parámetros de la URL. Generalmente se debe usar esto en lugar deurlparse()si la sintaxis de la URL más reciente permite que se apliquen parámetros a cada segmento de la parte de la ruta de la URL (ver RFC 2396).
¿Qué par de funciones de análisis de URL debo usar y por qué?
-
urlparseyurlunparse, o -
urlsplityurlunsplit?
Como dice el document
urlparse.urlparse devuelve 6-tupla (con tupla de parámetro adicional)
urlparse.urlsplit devuelve 5-tupla
Atributo | Índice | Valor | Valor si no está presente
params | 3 | Parámetros para el último elemento de ruta | cuerda vacía
FYI: según RFC2396 , parámetro en la especificación de URL
Las pruebas exhaustivas de las aplicaciones cliente actuales demostraron que la mayoría de los sistemas implementados no utilizan el ";" carácter para indicar la información de los parámetros finales, y que la presencia de un punto y coma en un segmento de ruta no afecta el análisis relativo de ese segmento. Por lo tanto, los parámetros se han eliminado como un componente separado y ahora pueden aparecer en cualquier segmento de ruta. Su influencia se ha eliminado del algoritmo para resolver una referencia URI relativa.