Por qué los pipes en la terminal pueden quedarse «atascados»: el papel del buffering

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Uno de los problemas más frustrantes al trabajar con la terminal es cuando un comando parece no devolver ningún resultado, incluso cuando debería hacerlo. Un caso común ocurre al encadenar comandos con pipes (|). Por ejemplo, al ejecutar:

tail -f /var/log/syslog | grep "error" | grep "fatal"

El usuario esperaría ver en tiempo real las líneas que contienen ambas palabras clave, pero en algunos casos, la salida no aparece hasta que un gran número de líneas ha sido procesado o hasta que el programa finaliza. Este comportamiento puede ser desconcertante, pero tiene una explicación técnica clara: el buffering.

¿Por qué ocurre este problema?

El problema de los pipes «atascados» no se debe a un fallo en la tubería (|), sino a que muchos programas almacenan temporalmente la salida antes de enviarla al siguiente proceso en la cadena. Esto ocurre porque escribir cada línea inmediatamente en una tubería o archivo es ineficiente en términos de llamadas al sistema. En su lugar, muchas aplicaciones acumulan datos en un buffer de unos 8 KB antes de escribir en la salida.

En el ejemplo anterior:

tail -f /var/log/syslog | grep "error" | grep "fatal"

El primer grep "error" no está enviando cada línea al siguiente grep "fatal" inmediatamente, sino que está acumulando datos en su buffer. Si no se alcanza el tamaño mínimo del buffer (por ejemplo, 8 KB), el segundo grep no recibe ninguna línea, dando la impresión de que el comando no funciona.

Cómo los programas manejan el buffering

El comportamiento de buffering en una aplicación depende de si está escribiendo su salida en un terminal o en una tubería:

Cuando escribe en un terminal, muchos programas usan buffering por línea, es decir, imprimen la salida inmediatamente línea por línea.
Cuando escriben en una tubería o archivo, la salida se almacena en un buffer y solo se escribe cuando se alcanza un tamaño mínimo (por ejemplo, 8 KB).

Este es el motivo por el que grep "error" /var/log/syslog funciona como se espera, mientras que tail -f /var/log/syslog | grep "error" también funciona, pero si se añade otro grep en la cadena, la salida puede no mostrarse de inmediato.

Ejemplo de comportamiento de buffering

Programa	Escribe en terminal	Escribe en pipe
`grep`	Inmediato (buffer línea)	Acumulado (buffer 8 KB)
`sed`	Inmediato con `-u`	Acumulado
`awk`	Inmediato si usa `fflush()`	Acumulado
`tail -f`	Inmediato	Inmediato

Cómo evitar el problema del buffering

Existen diversas estrategias para evitar que un pipe se quede atascado debido al buffering. A continuación, se presentan algunas soluciones:

1. Usar opciones para forzar el buffering por línea

Algunos programas permiten forzar el buffering por línea mediante opciones específicas:

tail -f /var/log/syslog | grep --line-buffered "error" | grep "fatal"

Para otros programas:

sed -u
awk con fflush()
tcpdump -l
jq -u
tr -u

2. Usar `stdbuf` para modificar el comportamiento del buffer

El comando stdbuf permite modificar el buffering de los programas en ejecución sin necesidad de modificar su código:

tail -f /var/log/syslog | stdbuf -oL grep "error" | stdbuf -oL grep "fatal"

Opciones de stdbuf:

-o0: Sin buffering.
-oL: Buffering por línea.

Sin embargo, stdbuf puede no funcionar en todas las plataformas o con programas compilados estáticamente.

3. Utilizar `unbuffer`

unbuffer (parte del paquete expect) fuerza a los programas a tratar la salida como si estuvieran escribiendo en un terminal, evitando el buffering en tuberías:

tail -f /var/log/syslog | unbuffer grep "error" | grep "fatal"

A diferencia de stdbuf, unbuffer suele ser más confiable.

4. Reescribir el comando para evitar tuberías innecesarias

En lugar de encadenar varios grep, se puede utilizar awk:

tail -f /var/log/syslog | awk '/error/ && /fatal/'

O usar grep -E para buscar múltiples patrones en una sola ejecución:

tail -f /var/log/syslog | grep -E 'error.*fatal'

5. Forzar un `flush` manualmente en scripts

En lenguajes de programación como Python, la salida estándar también usa buffering. Se puede desactivar así:

import sys
sys.stdout.reconfigure(line_buffering=True)

O ejecutando el script con:

python -u script.py

O estableciendo la variable de entorno:

export PYTHONUNBUFFERED=1

¿Qué pasa si presionamos Ctrl-C en una tubería?

Si se interrumpe un proceso con Ctrl-C, el contenido del buffer se pierde, porque el programa intermedio (grep, sed, etc.) nunca tuvo la oportunidad de escribir su salida. Una alternativa es matar el proceso con kill -TERM, lo que permite que el programa cierre correctamente y escriba el buffer pendiente.

ps aux | grep "tcpdump"
kill -TERM <PID>

Conclusión: Entender el buffering mejora la eficiencia en la terminal

El buffering en pipes no es un error, sino una optimización para mejorar el rendimiento del sistema. Sin embargo, puede ser problemático cuando se espera ver datos en tiempo real. Conocer cómo funciona y cómo evitarlo permite a los usuarios de la terminal trabajar de manera más eficiente y evitar problemas inesperados.

Cuando se detecta que un comando parece no estar mostrando resultados esperados, se pueden aplicar técnicas como --line-buffered, stdbuf, unbuffer, o reformular el comando para optimizar su flujo de procesamiento.

El conocimiento de estos detalles puede hacer la diferencia entre perder tiempo depurando un problema extraño y encontrar una solución rápida y eficiente.

Fuente: Julia Evans

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!

– patrocinadores –

Por qué los pipes en la terminal pueden quedarse «atascados»: el papel del buffering

¿Por qué ocurre este problema?

Cómo los programas manejan el buffering

Ejemplo de comportamiento de buffering

Cómo evitar el problema del buffering

1. Usar opciones para forzar el buffering por línea

2. Usar `stdbuf` para modificar el comportamiento del buffer

3. Utilizar `unbuffer`

4. Reescribir el comando para evitar tuberías innecesarias

5. Forzar un `flush` manualmente en scripts

¿Qué pasa si presionamos Ctrl-C en una tubería?

Conclusión: Entender el buffering mejora la eficiencia en la terminal

Suscríbete al boletín SysAdmin

¡Apúntate a nuestro newsletter!

Noticias destacadas

Guía Completa de Backups con Restic para Servidores RunCloud

Anuncio de la Nueva Versión Windows 11 Insider Preview Build 26220.7344 en Canales Dev y Beta

Guía para la Integración Real: Un Camino Hacia la Unidad

Innovaciones y desafíos de AIAI Toronto para 2025

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Noticias relacionadas

Guía Completa de Backups con Restic para Servidores RunCloud

Kopia, la alternativa moderna para backups cifrados: nueva guía completa para admins de sistemas

Anuncio de la Nueva Versión Windows 11 Insider Preview Build 26220.7344 en Canales Dev y Beta

Guía para la Integración Real: Un Camino Hacia la Unidad

Innovaciones y desafíos de AIAI Toronto para 2025

Proxmox Datacenter Manager 1.0: el “vCenter open source” que esperaban proveedores y sysadmins

Por qué los pipes en la terminal pueden quedarse «atascados»: el papel del buffering

¿Por qué ocurre este problema?

Cómo los programas manejan el buffering

Ejemplo de comportamiento de buffering

Cómo evitar el problema del buffering

1. Usar opciones para forzar el buffering por línea

2. Usar stdbuf para modificar el comportamiento del buffer

3. Utilizar unbuffer

4. Reescribir el comando para evitar tuberías innecesarias

5. Forzar un flush manualmente en scripts

¿Qué pasa si presionamos Ctrl-C en una tubería?

Conclusión: Entender el buffering mejora la eficiencia en la terminal

Suscríbete al boletín SysAdmin

¡Apúntate a nuestro newsletter!

Noticias destacadas

¡SUSCRÍBETE AL BOLETÍNDE LOS SYSADMINS!

Noticias relacionadas

2. Usar `stdbuf` para modificar el comportamiento del buffer

3. Utilizar `unbuffer`

5. Forzar un `flush` manualmente en scripts

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!