El comando wget es una herramienta de línea de comandos utilizada para descargar contenido de la web. Su nombre proviene de "World Wide Web" y "get", lo que sugiere su principal funcionalidad: obtener recursos de la web. Es una herramienta poderosa y versátil, ideal para automatizar descargas de archivos y espejar sitios web.
¿Cómo funciona wget?
wget opera mediante el protocolo HTTP, HTTPS, y FTP, permitiendo descargar archivos desde servidores web de manera no interactiva, lo que significa que puede ejecutarse en segundo plano sin necesidad de intervención del usuario. Además, wget es capaz de reanudar descargas interrumpidas, manejar proxies, y descargar archivos de manera recursiva, entre otras funciones avanzadas.
Uso básico de wget
La sintaxis básica de wget es:
wget [opciones] [URL]Ejemplo de uso básico
Para descargar un archivo de una URL específica:
wget http://example.com/archivo.zipDescargar en el directorio actual
wget http://example.com/archivo.zipEste comando descarga el archivo archivo.zip en el directorio actual.
Guardar con un nombre específico
wget -O nuevo_nombre.zip http://example.com/archivo.zipEsta opción guarda el archivo descargado con el nombre especificado .
Descargas recursivas
wget -r http://example.com/El uso de -r permite descargar el sitio completo de manera recursiva, siguiendo los enlaces internos.
Especificar nivel de profundidad
wget -r -l 1 http://example.com/La opción -l seguida de un número especifica el nivel de profundidad de los enlaces a seguir. En este ejemplo, -l 1 significa que solo se seguirán enlaces de un nivel.
Continuar una descarga interrumpida
wget -c http://example.com/archivo.zipLa opción -c (continuar) permite reanudar una descarga interrumpida.
Limitar la velocidad de descarga
wget --limit-rate=200k http://example.com/archivo.zipCon --limit-rate se puede limitar la velocidad de descarga a la cantidad especificada (por ejemplo, 200k para 200 kilobytes por segundo).
Descargar archivos en segundo plano
wget -b http://example.com/archivo.zipLa opción -b permite ejecutar wget en segundo plano, permitiendo al usuario continuar usando la terminal.
Descargar con autenticación
wget --user=usuario --password=contraseña http://example.com/archivo_protegido.zipSi el recurso a descargar está protegido por autenticación HTTP, wget puede enviar credenciales utilizando las opciones --user y --password.
Descargar múltiples archivos
Puedes descargar múltiples archivos listados en un archivo de texto:
wget -i lista_de_urls.txtDonde lista_de_urls.txt contiene una URL por línea.
Espejar un sitio web completo
Para hacer una copia completa de un sitio web, incluyendo todos los enlaces internos y mantener la estructura del directorio:
wget --mirror -p --convert-links -P ./local_dir http://example.com- --mirror es equivalente a usar -r -N -l inf --no-remove-listing.
- -p (page requisites) descarga todos los archivos necesarios para visualizar la página HTML, como imágenes y estilos CSS.
- --convert-links convierte los enlaces para que funcionen localmente.
- -P ./local_dir guarda los archivos en el directorio local_dir.
Descargar archivos de un sitio con SSL/TLS
Si necesitas descargar archivos de un sitio web seguro (HTTPS), wget maneja automáticamente el protocolo HTTPS. Sin embargo, si necesitas omitir la verificación del certificado SSL (no recomendado por razones de seguridad):
wget --no-check-certificate https://example.com/archivo.zipUsar proxy
Si te encuentras detrás de un proxy, wget permite configurarlo de la siguiente manera:
export http_proxy=http://proxy.example.com:8080
export https_proxy=https://proxy.example.com:8080
wget http://example.com/archivo.zipDescargar solo archivos nuevos
Para descargar solo archivos nuevos o más recientes que los existentes en tu directorio local:
wget -N http://example.com/archivo.zipDescarga en modo silencioso
Si no deseas ver la salida detallada del progreso de la descarga:
wget -q http://example.com/archivo.zipLa opción -q (quiet) suprime la salida.
Conclusión
wget es una herramienta poderosa para la descarga de archivos y sitios web completos desde la línea de comandos. Su versatilidad lo hace útil para tareas automatizadas, descargas grandes, manejo de proxies, y mucho más. Con las opciones y ejemplos presentados, puedes empezar a aprovechar wget para tus necesidades de descarga en diversas situaciones.
Comentarios