El comando cut es una herramienta diseñada para extraer secciones específicas de cada línea de texto de un archivo o entrada estándar.


El comando cut es una herramienta sencilla pero poderosa disponible en entornos GNU/Linux, diseñada para extraer secciones específicas de cada línea de texto de un archivo o entrada estándar. Este comando es fundamental para scripts y procesos que involucran la manipulación y análisis de datos planos, especialmente cuando se trabaja con archivos delimitados o de ancho fijo.

Uso del comando

cut se utiliza para extraer y mostrar partes especificadas de líneas de un archivo o entrada. Es muy útil para extraer columnas de texto en un archivo CSV, campos de un sistema de gestión de bases de datos, o cualquier parte de datos delimitados o de longitud fija.

Sintaxis básica

La sintaxis general de cut es la siguiente:

#
  • [OPCIONES]: Incluye opciones para definir cómo se deben cortar las líneas.
  • [FICHERO]: Es el nombre del archivo de entrada. Si no se especifica ningún archivo, cut lee desde la entrada estándar.

Opciones interesantes

El comando cut ofrece varias opciones que permiten a los usuarios especificar exactamente qué partes de cada línea deben ser extraídas:

  • -d, --delimiter=DELIMITER: Especifica un delimitador que será usado en lugar del delimitador por defecto, que es el tabulador.
  • -f, --fields=LIST: Selecciona por números de campo, dados como una lista de números o rangos, asumiendo que los campos están separados por el delimitador especificado.
  • -c, --characters=LIST: Selecciona sólo estos caracteres.
  • -b, --bytes=LIST: Selecciona solo estos bytes.

Ejemplos del comando

Veamos cómo usar cut en varios escenarios comunes para ilustrar su versatilidad y potencia:

Extraer una columna de un fichero CSV

Supongamos que tienes un archivo llamado datos.csv con múltiples columnas de datos separadas por comas. Para extraer la segunda columna (por ejemplo, email addresses), puedes usar:

$ cut -d',' -f2 datos.csv

Aquí, -d',' establece la coma como delimitador, y -f2 indica que solo se debe extraer la segunda columna.

Extraer múltiples campos de un archivo delimitado

Si deseas extraer, por ejemplo, el primer y tercer campo de un archivo delimitado por espacios, puedes hacer:

$ cut -d' ' -f1,3 archivo.txt

Esto mostrará solo el primer y tercer campo de cada línea.

Extraer un rango de carácteres

Para extraer caracteres desde la posición 5 hasta la 10 de cada línea en un archivo, usarías:

$ cut -c5-10 archivo.txt

Esto es útil cuando estás trabajando con datos de longitud fija y necesitas subcadenas específicas de texto.

Conclusión

El comando cut es una herramienta esencial para cualquier usuario de GNU/Linux que trabaje con manipulación de texto. Su simplicidad en diseño pero poder en ejecución permite a los usuarios realizar cortes precisos y eficientes de datos, facilitando la extracción y el análisis de información específica de archivos grandes o flujos de datos.


¿Buscas otro comando?

¡Revisa nuestro "Diccionario de comandos para GNU/Linux"!

Diccionario de comandos para GNU/Linux

Haz que cada palabra cuente: tu donación nos inspira a seguir creando contenido. Accede al apartado de Donación para hacer tu aportación