python - unquote - urllib parse download
¿Qué debería estar utilizando: urlparse o urlsplit? (2)
Directamente desde urlsplit :
urllib.parse.urlsplit(urlstring, scheme='''', allow_fragments=True)
Esto es similar aurlparse()
, pero no divide los parámetros de la URL. Generalmente se debe usar esto en lugar deurlparse()
si la sintaxis de la URL más reciente permite que se apliquen parámetros a cada segmento de la parte de la ruta de la URL (ver RFC 2396).
¿Qué par de funciones de análisis de URL debo usar y por qué?
-
urlparse
yurlunparse
, o -
urlsplit
yurlunsplit
?
Como dice el document
urlparse.urlparse
devuelve 6-tupla (con tupla de parámetro adicional)
urlparse.urlsplit
devuelve 5-tupla
Atributo | Índice | Valor | Valor si no está presente
params | 3 | Parámetros para el último elemento de ruta | cuerda vacía
FYI: según RFC2396 , parámetro en la especificación de URL
Las pruebas exhaustivas de las aplicaciones cliente actuales demostraron que la mayoría de los sistemas implementados no utilizan el ";" carácter para indicar la información de los parámetros finales, y que la presencia de un punto y coma en un segmento de ruta no afecta el análisis relativo de ese segmento. Por lo tanto, los parámetros se han eliminado como un componente separado y ahora pueden aparecer en cualquier segmento de ruta. Su influencia se ha eliminado del algoritmo para resolver una referencia URI relativa.