viernes, 5 de septiembre de 2008

Descargar una web completa

Si necesitas descargarte un sitio web completo para después verlo fuera de linea, wget puede hacer el trabajo, por ejemplo:

$ wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains website.org \
--no-parent \
www.website.org/tutorials/html/

El comando descarga el sitio web www.website.org/tutorials/html/.

Las opciones son:

  • --recursive: descarga el sitio web completo.

  • --domains website.org: no descarga enlaces fuera de website.org.

  • --no-parent: no sigue los enlaces fuera del directorio tutorials/html/.

  • --page-requisites: obtiene todos los elementos que componen la pagina (images, CSS, etc)

  • --html-extension: guarda los archivos con extensión .html

  • --convert-links: convierte los enlaces para que pueda trabajarse fuera de linea.

  • --restrict-file-names=windows: modifica el nombre de archivos para que también funcionen en Windows.

  • --no-clobber: no sobrescribe ningún archivo existente ( usado en caso la descarga es interrumpida y reanudada )




No hay comentarios: