El arte de reducir archivos: historia, evolución y comparativa de los formatos de compresión más usados

Desde el ZIP hasta el Zstandard, pasando por 7z, RAR o ARJ: cómo la compresión ha transformado el almacenamiento digital desde los años 80 hasta la nube moderna

Introducción

En la era de los terabytes y las transferencias instantáneas, puede parecer que la compresión de archivos ha perdido protagonismo. Pero nada más lejos de la realidad: sigue siendo fundamental para reducir costes de almacenamiento, acelerar descargas, automatizar backups y optimizar infraestructuras en la nube. Este artículo recorre la evolución de los principales formatos de compresión, desde los legendarios ARC, ARJ y ZIP, hasta los modernos Zstandard y LZ4, analizando sus fortalezas, limitaciones y casos de uso actuales.


📜 Historia: de los disquetes a los centros de datos

Los primeros formatos de compresión surgieron en los años 80 para ahorrar espacio en disquetes y facilitar la distribución de software por módem. Entre ellos:

  • ARC (1985): creado por System Enhancement Associates, fue uno de los primeros formatos todo-en-uno (archivado + compresión).
  • ZIP (1989): desarrollado por Phil Katz como respuesta abierta y más eficiente a ARC. Su éxito fue tal que Microsoft lo incorporó como estándar en Windows 98.
  • ARJ (1990): de Robert Jung, muy popular en la era MS-DOS por su rendimiento y opciones avanzadas, como segmentación automática.
  • LZH / LHA (1988–1990): de origen japonés, ampliamente utilizado en sistemas NEC PC-98 y en videojuegos de la era retro.

Con el auge de Internet y los archivos multimedia, surgieron nuevas necesidades: mayor compresión, soporte para grandes volúmenes, cifrado seguro y multihilo. Así aparecieron RAR (1993), 7z (1999) y más recientemente, Zstandard (2016).


🔍 Formatos antiguos ya obsoletos (fin de soporte)

FormatoExtensiónLanzamientoFin de uso habitualDetalles
ARC.arc1985~1995Reemplazado por ZIP. Obsoleto.
ARJ.arj1990~2005Usado en MS-DOS. Algunas herramientas lo leen.
LZH / LHA.lzh1988~2008Soporte en Japón hasta Windows Vista.
Q (Quantum).q~1989~1996Compresor rápido para MS-DOS. Desaparecido.
CAB.cab1994~2010Usado por Windows para instalar drivers.

📦 Formatos modernos (vigentes en 2025)

FormatoExtensiónCompresiónVentajas claveDesventajasAlgoritmo base
ZIP.zipMediaCompatibilidad, rápidoMenor ratio de compresiónDEFLATE
7z (7-Zip).7zMuy altaCompresión sólida, AES-256, open sourceLento, especialmente al comprimirLZMA, LZMA2
RAR / RAR5.rarAltaReparación, cifrado, sólidoFormato propietario, sin lib libreAlgoritmo RAR propietario
TAR.GZ.tar.gzAltaIdeal para backups en LinuxNo permite navegación sin descomprimirGzip + archivado TAR
XZ / TAR.XZ.xz, .tar.xzMuy altaCompacto, buen ratio para backupsMuy lento, requiere CPU potenteLZMA2
Zstandard (Zstd).zstAltaMuy rápido, moderno, Facebook-backedMenos adoptado en entorno WindowsZstandard
LZ4.lz4Baja–mediaExtremadamente rápidoRatio bajo de compresiónLZ4
BZIP2.bz2AltaMejores ratios que gzip, sin pérdidaMuy lento, poco usado hoyBurrows-Wheeler + Huffman

🌍 Compatibilidad multiplataforma

SistemaZIPRAR7zTAR.GZXZZstdBZIP2
Windows⚠️ (con software)⚠️⚠️⚠️
macOS⚠️
Linux✅*
Android⚠️⚠️⚠️⚠️
iOS⚠️⚠️⚠️⚠️⚠️

*En Linux, unrar gratuito permite descomprimir, pero no crear archivos .rar.


📈 Comparativa de rendimiento

FormatoRatio compresión (ENWIK8)Velocidad compresiónVelocidad descompresión
ZIP~30 MBMuy rápidaMuy rápida
7z (Ultra)~18 MBLentaRápida
RAR5~20 MBMediaMedia
TAR.GZ~23 MBRápidaRápida
TAR.XZ~17 MBMuy lentaLenta
Zstandard~19 MBMuy rápidaMuy rápida
BZIP2~21 MBMuy lentaLenta
LZ4~30 MBUltra rápidaUltra rápida

Fuente: Pruebas replicadas con archivos de texto plano (ENWIK8) y herramientas como lzbench, 7z, zstd.


☁️ Compresión y la nube

Hoy, la compresión juega un papel vital en servicios cloud:

  • AWS Lambda y S3: admiten compresión Gzip y Zstd para archivos y respuestas HTTP.
  • Docker y contenedores: usan formatos comprimidos como tar.gz, tar.zst para imágenes.
  • Backups automáticos: herramientas como BorgBackup, Restic o Duplicacy emplean Zstandard o LZMA.
  • CI/CD: Jenkins, GitHub Actions o GitLab usan ZIP o TAR para empaquetado de artefactos.

🏆 Récords de compresión

Los formatos ultraeficientes como PAQ, CMIX o Krak han batido récords en benchmarks como Calgary Corpus o en el desafío Hutter Prize:

  • PAQ8PX puede reducir ENWIK8 (100 MB) hasta 12,6 MB.
  • Son muy lentos (pueden tardar horas), pero demuestran el límite teórico de compresión.

✅ ¿Qué formato elegir?

NecesidadFormato recomendado
Compatibilidad universalZIP
Alta compresión sin prisas7z, TAR.XZ
Velocidad (aplicaciones en tiempo real)Zstandard, LZ4
Cifrado fuerte7z (AES-256), RAR
Backups en Linux/servidoresTAR.ZST, TAR.XZ
Apps móvilesZIP, RAR
Reproducción retro (emuladores)LHA, ARJ, ZIP

🧠 Conclusión

Lejos de estar en desuso, la compresión sigue reinventándose. Con la aparición de discos SSD, el coste del almacenamiento sigue bajando, pero el tiempo, la energía y el ancho de banda siguen siendo limitados. Por eso, formatos como Zstandard se están convirtiendo en el nuevo estándar de facto para software moderno, mientras 7-Zip mantiene su liderazgo en archivado gratuito y eficiente.

Desde los disquetes de 360 KB hasta los contenedores Docker en la nube, comprimir archivos es tanto un arte como una ciencia. Y seguirá siéndolo mientras los datos crezcan sin parar.


Referencias técnicas y utilidades:

¿Te dedicas a la programación, a la gestión de sistemas o simplemente quieres optimizar tu espacio? Conocer bien los formatos de compresión es una ventaja competitiva real.

Fuente: Revista Cloud

Suscríbete al boletín SysAdmin

Este es tu recurso para las últimas noticias y consejos sobre administración de sistemas, Linux, Windows, cloud computing, seguridad de la nube, etc. Lo enviamos 2 días a la semana.

¡Apúntate a nuestro newsletter!


– patrocinadores –

Noticias destacadas

– patrocinadores –

¡SUSCRÍBETE AL BOLETÍN
DE LOS SYSADMINS!

Scroll al inicio
×