El comando wget es una herramienta de línea de comandos utilizada para descargar contenido de la web.


El comando wget es una herramienta de línea de comandos utilizada para descargar contenido de la web. Su nombre proviene de "World Wide Web" y "get", lo que sugiere su principal funcionalidad: obtener recursos de la web. Es una herramienta poderosa y versátil, ideal para automatizar descargas de archivos y espejar sitios web.

¿Cómo funciona wget?

wget opera mediante el protocolo HTTP, HTTPS, y FTP, permitiendo descargar archivos desde servidores web de manera no interactiva, lo que significa que puede ejecutarse en segundo plano sin necesidad de intervención del usuario. Además, wget es capaz de reanudar descargas interrumpidas, manejar proxies, y descargar archivos de manera recursiva, entre otras funciones avanzadas.

Uso básico de wget

La sintaxis básica de wget es:

wget [opciones] [URL]

Ejemplo de uso básico

Para descargar un archivo de una URL específica:

wget http://example.com/archivo.zip

Descargar en el directorio actual

wget http://example.com/archivo.zip

Este comando descarga el archivo archivo.zip en el directorio actual.

Guardar con un nombre específico

wget -O nuevo_nombre.zip http://example.com/archivo.zip

Esta opción guarda el archivo descargado con el nombre especificado .

Descargas recursivas

wget -r http://example.com/

El uso de -r permite descargar el sitio completo de manera recursiva, siguiendo los enlaces internos.

Especificar nivel de profundidad

wget -r -l 1 http://example.com/

La opción -l seguida de un número especifica el nivel de profundidad de los enlaces a seguir. En este ejemplo, -l 1 significa que solo se seguirán enlaces de un nivel.

Continuar una descarga interrumpida

wget -c http://example.com/archivo.zip

La opción -c (continuar) permite reanudar una descarga interrumpida.

Limitar la velocidad de descarga

wget --limit-rate=200k http://example.com/archivo.zip

Con --limit-rate se puede limitar la velocidad de descarga a la cantidad especificada (por ejemplo, 200k para 200 kilobytes por segundo).

Descargar archivos en segundo plano

wget -b http://example.com/archivo.zip

La opción -b permite ejecutar wget en segundo plano, permitiendo al usuario continuar usando la terminal.

Descargar con autenticación

wget --user=usuario --password=contraseña http://example.com/archivo_protegido.zip

Si el recurso a descargar está protegido por autenticación HTTP, wget puede enviar credenciales utilizando las opciones --user y --password.

Descargar múltiples archivos

Puedes descargar múltiples archivos listados en un archivo de texto:

wget -i lista_de_urls.txt

Donde lista_de_urls.txt contiene una URL por línea.

Espejar un sitio web completo

Para hacer una copia completa de un sitio web, incluyendo todos los enlaces internos y mantener la estructura del directorio:

wget --mirror -p --convert-links -P ./local_dir http://example.com
  • --mirror es equivalente a usar -r -N -l inf --no-remove-listing.
  • -p (page requisites) descarga todos los archivos necesarios para visualizar la página HTML, como imágenes y estilos CSS.
  • --convert-links convierte los enlaces para que funcionen localmente.
  • -P ./local_dir guarda los archivos en el directorio local_dir.

Descargar archivos de un sitio con SSL/TLS

Si necesitas descargar archivos de un sitio web seguro (HTTPS), wget maneja automáticamente el protocolo HTTPS. Sin embargo, si necesitas omitir la verificación del certificado SSL (no recomendado por razones de seguridad):

wget --no-check-certificate https://example.com/archivo.zip

Usar proxy

Si te encuentras detrás de un proxy, wget permite configurarlo de la siguiente manera:

export http_proxy=http://proxy.example.com:8080
export https_proxy=https://proxy.example.com:8080
wget http://example.com/archivo.zip

Descargar solo archivos nuevos

Para descargar solo archivos nuevos o más recientes que los existentes en tu directorio local:

wget -N http://example.com/archivo.zip

Descarga en modo silencioso

Si no deseas ver la salida detallada del progreso de la descarga:

wget -q http://example.com/archivo.zip

La opción -q (quiet) suprime la salida.

Conclusión

wget es una herramienta poderosa para la descarga de archivos y sitios web completos desde la línea de comandos. Su versatilidad lo hace útil para tareas automatizadas, descargas grandes, manejo de proxies, y mucho más. Con las opciones y ejemplos presentados, puedes empezar a aprovechar wget para tus necesidades de descarga en diversas situaciones.


¿Buscas otro comando?

¡Revisa nuestro "Diccionario de comandos para GNU/Linux"!

Diccionario de comandos para GNU/Linux

Haz que cada palabra cuente: tu donación nos inspira a seguir creando contenido. Accede al apartado de Donación para hacer tu aportación