Desde el ZIP hasta el Zstandard, pasando por 7z, RAR o ARJ: cómo la compresión ha transformado el almacenamiento digital desde los años 80 hasta la nube moderna
Introducción
En la era de los terabytes y las transferencias instantáneas, puede parecer que la compresión de archivos ha perdido protagonismo. Pero nada más lejos de la realidad: sigue siendo fundamental para reducir costes de almacenamiento, acelerar descargas, automatizar backups y optimizar infraestructuras en la nube. Este artículo recorre la evolución de los principales formatos de compresión, desde los legendarios ARC, ARJ y ZIP, hasta los modernos Zstandard y LZ4, analizando sus fortalezas, limitaciones y casos de uso actuales.
📜 Historia: de los disquetes a los centros de datos
Los primeros formatos de compresión surgieron en los años 80 para ahorrar espacio en disquetes y facilitar la distribución de software por módem. Entre ellos:
- ARC (1985): creado por System Enhancement Associates, fue uno de los primeros formatos todo-en-uno (archivado + compresión).
- ZIP (1989): desarrollado por Phil Katz como respuesta abierta y más eficiente a ARC. Su éxito fue tal que Microsoft lo incorporó como estándar en Windows 98.
- ARJ (1990): de Robert Jung, muy popular en la era MS-DOS por su rendimiento y opciones avanzadas, como segmentación automática.
- LZH / LHA (1988–1990): de origen japonés, ampliamente utilizado en sistemas NEC PC-98 y en videojuegos de la era retro.
Con el auge de Internet y los archivos multimedia, surgieron nuevas necesidades: mayor compresión, soporte para grandes volúmenes, cifrado seguro y multihilo. Así aparecieron RAR (1993), 7z (1999) y más recientemente, Zstandard (2016).
🔍 Formatos antiguos ya obsoletos (fin de soporte)
Formato | Extensión | Lanzamiento | Fin de uso habitual | Detalles |
---|---|---|---|---|
ARC | .arc | 1985 | ~1995 | Reemplazado por ZIP. Obsoleto. |
ARJ | .arj | 1990 | ~2005 | Usado en MS-DOS. Algunas herramientas lo leen. |
LZH / LHA | .lzh | 1988 | ~2008 | Soporte en Japón hasta Windows Vista. |
Q (Quantum) | .q | ~1989 | ~1996 | Compresor rápido para MS-DOS. Desaparecido. |
CAB | .cab | 1994 | ~2010 | Usado por Windows para instalar drivers. |
📦 Formatos modernos (vigentes en 2025)
Formato | Extensión | Compresión | Ventajas clave | Desventajas | Algoritmo base |
---|---|---|---|---|---|
ZIP | .zip | Media | Compatibilidad, rápido | Menor ratio de compresión | DEFLATE |
7z (7-Zip) | .7z | Muy alta | Compresión sólida, AES-256, open source | Lento, especialmente al comprimir | LZMA, LZMA2 |
RAR / RAR5 | .rar | Alta | Reparación, cifrado, sólido | Formato propietario, sin lib libre | Algoritmo RAR propietario |
TAR.GZ | .tar.gz | Alta | Ideal para backups en Linux | No permite navegación sin descomprimir | Gzip + archivado TAR |
XZ / TAR.XZ | .xz, .tar.xz | Muy alta | Compacto, buen ratio para backups | Muy lento, requiere CPU potente | LZMA2 |
Zstandard (Zstd) | .zst | Alta | Muy rápido, moderno, Facebook-backed | Menos adoptado en entorno Windows | Zstandard |
LZ4 | .lz4 | Baja–media | Extremadamente rápido | Ratio bajo de compresión | LZ4 |
BZIP2 | .bz2 | Alta | Mejores ratios que gzip, sin pérdida | Muy lento, poco usado hoy | Burrows-Wheeler + Huffman |
🌍 Compatibilidad multiplataforma
Sistema | ZIP | RAR | 7z | TAR.GZ | XZ | Zstd | BZIP2 |
---|---|---|---|---|---|---|---|
Windows | ✅ | ✅ | ✅ | ⚠️ (con software) | ⚠️ | ⚠️ | ⚠️ |
macOS | ✅ | ✅ | ✅ | ✅ | ✅ | ⚠️ | ✅ |
Linux | ✅ | ✅* | ✅ | ✅ | ✅ | ✅ | ✅ |
Android | ✅ | ✅ | ✅ | ⚠️ | ⚠️ | ⚠️ | ⚠️ |
iOS | ✅ | ⚠️ | ⚠️ | ⚠️ | ⚠️ | ❌ | ⚠️ |
*En Linux,
unrar
gratuito permite descomprimir, pero no crear archivos .rar.
📈 Comparativa de rendimiento
Formato | Ratio compresión (ENWIK8) | Velocidad compresión | Velocidad descompresión |
---|---|---|---|
ZIP | ~30 MB | Muy rápida | Muy rápida |
7z (Ultra) | ~18 MB | Lenta | Rápida |
RAR5 | ~20 MB | Media | Media |
TAR.GZ | ~23 MB | Rápida | Rápida |
TAR.XZ | ~17 MB | Muy lenta | Lenta |
Zstandard | ~19 MB | Muy rápida | Muy rápida |
BZIP2 | ~21 MB | Muy lenta | Lenta |
LZ4 | ~30 MB | Ultra rápida | Ultra rápida |
Fuente: Pruebas replicadas con archivos de texto plano (ENWIK8) y herramientas como
lzbench
,7z
,zstd
.
☁️ Compresión y la nube
Hoy, la compresión juega un papel vital en servicios cloud:
- AWS Lambda y S3: admiten compresión Gzip y Zstd para archivos y respuestas HTTP.
- Docker y contenedores: usan formatos comprimidos como
tar.gz
,tar.zst
para imágenes. - Backups automáticos: herramientas como BorgBackup, Restic o Duplicacy emplean Zstandard o LZMA.
- CI/CD: Jenkins, GitHub Actions o GitLab usan ZIP o TAR para empaquetado de artefactos.
🏆 Récords de compresión
Los formatos ultraeficientes como PAQ, CMIX o Krak han batido récords en benchmarks como Calgary Corpus o en el desafío Hutter Prize:
- PAQ8PX puede reducir ENWIK8 (100 MB) hasta 12,6 MB.
- Son muy lentos (pueden tardar horas), pero demuestran el límite teórico de compresión.
✅ ¿Qué formato elegir?
Necesidad | Formato recomendado |
---|---|
Compatibilidad universal | ZIP |
Alta compresión sin prisas | 7z, TAR.XZ |
Velocidad (aplicaciones en tiempo real) | Zstandard, LZ4 |
Cifrado fuerte | 7z (AES-256), RAR |
Backups en Linux/servidores | TAR.ZST, TAR.XZ |
Apps móviles | ZIP, RAR |
Reproducción retro (emuladores) | LHA, ARJ, ZIP |
🧠 Conclusión
Lejos de estar en desuso, la compresión sigue reinventándose. Con la aparición de discos SSD, el coste del almacenamiento sigue bajando, pero el tiempo, la energía y el ancho de banda siguen siendo limitados. Por eso, formatos como Zstandard se están convirtiendo en el nuevo estándar de facto para software moderno, mientras 7-Zip mantiene su liderazgo en archivado gratuito y eficiente.
Desde los disquetes de 360 KB hasta los contenedores Docker en la nube, comprimir archivos es tanto un arte como una ciencia. Y seguirá siéndolo mientras los datos crezcan sin parar.
Referencias técnicas y utilidades:
- https://7-zip.org
- https://github.com/facebook/zstd
- https://www.rarlab.com
- https://peazip.github.io
- https://github.com/inikep/lzbench
¿Te dedicas a la programación, a la gestión de sistemas o simplemente quieres optimizar tu espacio? Conocer bien los formatos de compresión es una ventaja competitiva real.
Fuente: Revista Cloud