wget - guia - ¿Cómo reflejar solo una sección de un sitio web?
qgis manual (3)
No puedo entender cómo reflejar una sección de un sitio web (una ruta de carpeta debajo de la raíz); parece que solo funciona desde la página principal del sitio web.
He intentado muchas opciones, aquí hay un ejemplo
wget -rkp -l3 -np http://somewebsite/subpath/down/here/
Si bien solo quiero reflejar los enlaces de contenido debajo de esa URL, también necesito descargar todos los elementos de la página que no estén en esa ruta.
Parece que funciona bien para la página de inicio ( /
) pero no puedo ponerlo en funcionamiento para ninguna subcarpeta.
Use las --mirror
( -m
) y --no-parent
( -np
), más algunas de las más interesantes, como en este ejemplo:
wget --mirror --page-requisites --adjust-extension --no-parent --convert-links
--directory-prefix=sousers http://.com/users
Usualmente uso:
wget -m -np -p $url
Utilizo pavuk para lograr espejos, ya que parecía mucho mejor para este propósito desde el principio. Puedes usar algo como esto:
/usr/bin/pavuk -enable_js -fnrules F ''*.php?*'' ''%o.php'' -tr_str_str ''?'' ''_questionmark_'' /
-norobots -dont_limit_inlines -dont_leave_dir /
http://www.example.com/some_directory/ >OUT 2>ERR