{"id":4182,"date":"2025-06-29T11:35:02","date_gmt":"2025-06-29T16:35:02","guid":{"rendered":"https:\/\/zidrave.net\/?p=4182"},"modified":"2025-06-29T11:49:20","modified_gmt":"2025-06-29T16:49:20","slug":"hablemos-sobre-compresion-de-datos","status":"publish","type":"post","link":"https:\/\/zidrave.net\/index.php\/2025\/06\/29\/hablemos-sobre-compresion-de-datos\/","title":{"rendered":"Hablemos sobre Compresi\u00f3n de Datos"},"content":{"rendered":"\n<p>La necesidad de <strong>comprimir informaci\u00f3n<\/strong> es tan antigua como la inform\u00e1tica misma\u2026 y a\u00fan m\u00e1s. Desde el uso de <strong>c\u00f3digos breves en telegraf\u00eda<\/strong> hasta los complejos algoritmos que hoy permiten almacenar terabytes en segundos, la compresi\u00f3n de datos ha sido una pieza fundamental en la evoluci\u00f3n digital.<\/p>\n\n\n\n<p>Este art\u00edculo repasa su historia desde sus or\u00edgenes hasta los algoritmos m\u00e1s poderosos del presente.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"500\" height=\"261\" src=\"https:\/\/zidrave.net\/wp-content\/uploads\/2025\/06\/image-27.png\" alt=\"\" class=\"wp-image-4183\" style=\"width:598px;height:auto\" srcset=\"https:\/\/zidrave.net\/wp-content\/uploads\/2025\/06\/image-27.png 500w, https:\/\/zidrave.net\/wp-content\/uploads\/2025\/06\/image-27-300x157.png 300w\" sizes=\"auto, (max-width: 500px) 100vw, 500px\" \/><\/figure>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\u2699\ufe0f \u00bfQu\u00e9 es la compresi\u00f3n de datos?<\/h2>\n\n\n\n<p>La <strong>compresi\u00f3n<\/strong> es un proceso para reducir el tama\u00f1o de la informaci\u00f3n, eliminando redundancias o representando los datos de forma m\u00e1s eficiente. Existen dos tipos principales:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Lossless (sin p\u00e9rdida)<\/strong>: Se puede recuperar el archivo original exactamente.<\/li>\n\n\n\n<li><strong>Lossy (con p\u00e9rdida)<\/strong>: Se pierde parte de la informaci\u00f3n original, generalmente imperceptible al ojo o o\u00eddo humano (im\u00e1genes, audio, video).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udcdc Primeros pasos: compresi\u00f3n antes de los ordenadores<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>C\u00f3digo Morse (1836)<\/strong>: Es uno de los primeros m\u00e9todos de compresi\u00f3n. Las letras m\u00e1s frecuentes (como la \u201cE\u201d) usaban los c\u00f3digos m\u00e1s cortos. Este principio se refleja luego en algoritmos como Huffman.<\/li>\n\n\n\n<li><strong>Codificaci\u00f3n telegr\u00e1fica y taquigraf\u00eda<\/strong>: T\u00e9cnicas humanas para reducir tiempo y espacio al comunicar mensajes, anticipando el concepto de compresi\u00f3n textual.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\udde0 A\u00f1os 1940\u20131950: primeros fundamentos te\u00f3ricos<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>1948 \u2013 Claude Shannon<\/strong> publica su obra maestra: <em>A Mathematical Theory of Communication<\/em>.<br>Introduce conceptos clave como <strong>entrop\u00eda de informaci\u00f3n<\/strong>, que describe los l\u00edmites te\u00f3ricos de la compresi\u00f3n. Su trabajo marca el nacimiento de la <strong>teor\u00eda de la informaci\u00f3n<\/strong>, base matem\u00e1tica de todos los algoritmos modernos.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\uddfe A\u00f1os 1970\u20131980: llegan los algoritmos cl\u00e1sicos<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udd38 Huffman Coding (1952, uso masivo en los 70s)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Asigna c\u00f3digos m\u00e1s cortos a los s\u00edmbolos m\u00e1s frecuentes.<\/li>\n\n\n\n<li>Muy utilizado en compresores de texto (como DEFLATE).<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udd38 Lempel-Ziv (LZ77 y LZ78)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>1977 y 1978<\/strong>: Abraham Lempel y Jacob Ziv desarrollan dos algoritmos revolucionarios:\n<ul class=\"wp-block-list\">\n<li><strong>LZ77<\/strong>: Usa punteros a secuencias repetidas en el texto anterior.<\/li>\n\n\n\n<li><strong>LZ78<\/strong>: Forma un diccionario din\u00e1mico de frases encontradas.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<p>Ambos sientan las bases de <strong>ZIP<\/strong>, <strong>GIF<\/strong>, <strong>PNG<\/strong>, <strong>PDF<\/strong>, y m\u00e1s.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\uddc2\ufe0f A\u00f1os 1980\u20131990: los formatos se estandarizan<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udce6 ZIP (1989)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Introducido por Phil Katz. Usa <strong>DEFLATE<\/strong>, una combinaci\u00f3n de <strong>LZ77 + Huffman<\/strong>.<\/li>\n\n\n\n<li>Se convierte en est\u00e1ndar de facto para empaquetar archivos.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83c\udf08 GIF (1987)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Primer formato gr\u00e1fico ampliamente distribuido que usa <strong>LZW<\/strong> (una mejora de LZ78).<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udd08 MP3 (1993)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Primer formato de audio <em>lossy<\/em> de consumo masivo.<\/li>\n\n\n\n<li>Usa psicoac\u00fastica para eliminar sonidos que el o\u00eddo humano no percibe.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83c\udfa5 MPEG-1 (1993)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Compresi\u00f3n de video basada en eliminaci\u00f3n de redundancia temporal.<\/li>\n\n\n\n<li>Precursor de VCD, MP2 y m\u00e1s.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udd0d A\u00f1os 1990\u20132000: compresi\u00f3n \u00f3ptima vs velocidad<\/h2>\n\n\n\n<p>Surgen algoritmos <strong>m\u00e1s potentes pero lentos<\/strong>, ideales para investigaci\u00f3n:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 PAQ (2002)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Basado en <strong>modelos estad\u00edsticos adaptativos y predicci\u00f3n por contexto<\/strong>.<\/li>\n\n\n\n<li>Consigue tasas de compresi\u00f3n extremadamente altas.<\/li>\n\n\n\n<li>Impr\u00e1ctico para uso diario debido a su lentitud.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\uddea BZIP2 (1996)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Usa el <strong>algoritmo de Burrows-Wheeler + Huffman<\/strong>.<\/li>\n\n\n\n<li>Mejor compresi\u00f3n que ZIP, pero m\u00e1s lento.<\/li>\n\n\n\n<li>Muy usado en Linux (por ejemplo, <code>.tar.bz2<\/code>).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\ude80 A\u00f1os 2010\u2013presente: velocidad y potencia para el mundo moderno<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\u26a1 LZ4 (2011)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Ultrar\u00e1pido. Ideal para compresi\u00f3n de disco en tiempo real.<\/li>\n\n\n\n<li>Usado en bases de datos, kernels, y sistemas de archivos.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\u2696\ufe0f Zstandard (Zstd) (2016)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Creado por <strong>Facebook<\/strong>.<\/li>\n\n\n\n<li>Excelente balance entre velocidad y compresi\u00f3n.<\/li>\n\n\n\n<li>Adoptado en <strong>Linux<\/strong>, <code>tar<\/code>, <code>zstd<\/code>-compressed packages, Git, etc.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 CMIX (2011\u2013hoy)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Algoritmo extremadamente potente (supera PAQ), basado en IA y predicci\u00f3n avanzada.<\/li>\n\n\n\n<li>No se usa comercialmente por su lentitud, pero es el <em>gold standard<\/em> de compresi\u00f3n sin p\u00e9rdida.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udcf9 AV1 (2018)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Compresi\u00f3n <em>lossy<\/em> de video moderna, libre de royalties.<\/li>\n\n\n\n<li>Adoptado por YouTube, Netflix, Twitch.<\/li>\n\n\n\n<li>Sustituye a H.264 y HEVC en entornos libres.<\/li>\n<\/ul>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udce6 RAR \u2013 La compresi\u00f3n propietaria que domin\u00f3 los 2000<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\ud83d\udcc5 <strong>A\u00f1o de lanzamiento<\/strong>: 1993<\/li>\n\n\n\n<li>\ud83e\uddd1\u200d\ud83d\udcbb <strong>Creador<\/strong>: Eugene Roshal<\/li>\n\n\n\n<li>\ud83d\udccd <strong>Nombre<\/strong>: <strong>RAR<\/strong> significa <em>Roshal ARchive<\/em><\/li>\n\n\n\n<li>\ud83d\udd10 <strong>Licencia<\/strong>: <strong>Propietaria<\/strong>, a diferencia de ZIP o 7z<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udcdd Caracter\u00edsticas:<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Compresi\u00f3n mejor que ZIP en la mayor\u00eda de los casos.<\/li>\n\n\n\n<li>Soporte de <strong>vol\u00famenes divididos<\/strong>, recuperaci\u00f3n de errores y archivos autoextra\u00edbles.<\/li>\n\n\n\n<li>Compresi\u00f3n s\u00f3lida (solid compression) para datos repetitivos.<\/li>\n\n\n\n<li>Soporta cifrado AES-128 desde versiones modernas.<\/li>\n\n\n\n<li>Usado ampliamente en distribuci\u00f3n de software, juegos, y contenido en l\u00ednea en la era de foros, RapidShare y similares.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udce6 WinRAR: el emblema del formato<\/h3>\n\n\n\n<p>Aunque el formato <strong>RAR<\/strong> es propietario, el programa <strong>WinRAR<\/strong> (tambi\u00e9n creado por Roshal) se convirti\u00f3 en el descompresor y compresor por excelencia de Windows desde los 90 hasta bien entrada la d\u00e9cada de 2010.<\/p>\n\n\n\n<p>Curiosamente, <strong>WinRAR es famoso por su per\u00edodo de prueba que nunca caduca<\/strong>: se puede seguir usando sin pagar, con solo cerrar el aviso de \u00abcomprar licencia\u00bb.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u2696\ufe0f Comparado con otros:<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Mejor compresi\u00f3n que ZIP.<\/li>\n\n\n\n<li>M\u00e1s lento que ZIP o Zstd.<\/li>\n\n\n\n<li>No es tan eficiente como 7z o Zstandard para ciertos tipos de datos.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udd16 Soporte en Linux y otros sistemas:<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Linux y macOS no incluyen soporte RAR de forma nativa.<\/li>\n\n\n\n<li>Se pueden usar utilidades como <code>unrar<\/code> o <code>rar<\/code> (no siempre libres).<\/li>\n\n\n\n<li>El c\u00f3digo del descompresor es gratuito pero <strong>no libre\/open-source<\/strong>.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\udde9 \u00bfRAR sigue siendo relevante?<\/h2>\n\n\n\n<p>Aunque RAR ya no domina como antes, sigue siendo:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Muy usado en archivos de instalaci\u00f3n comprimidos.<\/li>\n\n\n\n<li>Com\u00fan en archivos antiguos, backups o archivos compartidos por usuarios avanzados.<\/li>\n\n\n\n<li>Reconocido como uno de los pocos formatos <strong>con fiabilidad de recuperaci\u00f3n de datos internos<\/strong> en caso de corrupci\u00f3n.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\udde9 Compresi\u00f3n hoy: un equilibrio constante<\/h2>\n\n\n\n<p>Hoy en d\u00eda, la compresi\u00f3n busca el <strong>mejor equilibrio<\/strong> entre:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\ud83e\udde0 Eficiencia de compresi\u00f3n<\/li>\n\n\n\n<li>\u26a1 Velocidad de compresi\u00f3n\/descompresi\u00f3n<\/li>\n\n\n\n<li>\ud83d\udd0b Uso de recursos (RAM, CPU)<\/li>\n\n\n\n<li>\ud83d\udd12 Soporte de seguridad y cifrado<\/li>\n\n\n\n<li>\ud83c\udf10 Compatibilidad con flujos en red y archivos masivos<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udddc\ufe0f \u00bfY en Linux que se comprime?<\/h2>\n\n\n\n<p>El archivo <code>.tar.gz<\/code> es un formato <strong>combinado<\/strong> de empaquetado y compresi\u00f3n muy com\u00fan en sistemas Linux y Unix. Consiste en:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong><code>.tar<\/code><\/strong> \u2013 Empaqueta varios archivos en uno solo (<em>sin compresi\u00f3n<\/em>).<\/li>\n\n\n\n<li><strong><code>.gz<\/code><\/strong> \u2013 Comprime ese paquete usando <strong>Gzip<\/strong> (<em>compresi\u00f3n con p\u00e9rdida cero<\/em>).<\/li>\n<\/ol>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>\ud83d\udce6 <code>.tar.gz<\/code> = empaquetar con <strong>tar<\/strong> + comprimir con <strong>gzip<\/strong><\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\uddf0 \u00bfQu\u00e9 hace cada parte?<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udcc1 <code>tar<\/code> \u2013 Tape Archive<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Originalmente creado para almacenar datos en cintas magn\u00e9ticas.<\/li>\n\n\n\n<li>Une muchos archivos y carpetas en un <strong>solo archivo <code>.tar<\/code><\/strong>, conservando:\n<ul class=\"wp-block-list\">\n<li>Estructura de carpetas<\/li>\n\n\n\n<li>Permisos de archivos<\/li>\n\n\n\n<li>Fechas de modificaci\u00f3n<\/li>\n\n\n\n<li>Due\u00f1os y grupos<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Ejemplo: <code>documentos<\/code>, <code>im\u00e1genes<\/code>, <code>notas.txt<\/code> \u2192 <code>backup.tar<\/code><\/p>\n<\/blockquote>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udddc\ufe0f <code>gzip<\/code> \u2013 GNU Zip<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Algoritmo de compresi\u00f3n basado en <strong>DEFLATE<\/strong> (LZ77 + Huffman).<\/li>\n\n\n\n<li>Comprime <strong>archivos individuales<\/strong>, por eso se aplica despu\u00e9s de crear el <code>.tar<\/code>.<\/li>\n\n\n\n<li>Produce archivos <code>.gz<\/code>, com\u00fan en logs, paquetes y transmisiones.<\/li>\n<\/ul>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><code>backup.tar<\/code> \u2192 <code>backup.tar.gz<\/code><\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\u2699\ufe0f \u00bfC\u00f3mo se crea un <code>.tar.gz<\/code>?<\/h2>\n\n\n\n<p><strong>Comando t\u00edpico:<\/strong><\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>tar -czvf archivo.tar.gz carpeta_o_archivo<\/code><\/pre>\n\n\n\n<ul class=\"wp-block-list\">\n<li><code>-c<\/code>: crear nuevo archivo<\/li>\n\n\n\n<li><code>-z<\/code>: usar gzip para comprimir<\/li>\n\n\n\n<li><code>-v<\/code>: modo detallado (verbose)<\/li>\n\n\n\n<li><code>-f<\/code>: nombre del archivo de salida<\/li>\n<\/ul>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Ejemplo:<\/strong><\/p>\n<\/blockquote>\n\n\n\n<pre class=\"wp-block-code\"><code>tar -czvf backup.tar.gz \/home\/usuario\/mis_datos<\/code><\/pre>\n\n\n\n<p>\ud83d\udd0d<strong> \u00bfY c\u00f3mo se extrae?<\/strong><\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>tar -xzvf archivo.tar.gz<\/code><\/pre>\n\n\n\n<ul class=\"wp-block-list\">\n<li><code>-x<\/code>: extraer<\/li>\n\n\n\n<li><code>-z<\/code>: usar gzip para descomprimir<\/li>\n\n\n\n<li><code>-v<\/code>: mostrar archivos<\/li>\n\n\n\n<li><code>-f<\/code>: nombre del archivo<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\uddea \u00bfQu\u00e9 tan buena es la compresi\u00f3n?<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><code>.tar.gz<\/code> no es el m\u00e1s eficiente (Zstd y 7z comprimen mejor).<\/li>\n\n\n\n<li>Pero es <strong>r\u00e1pido, ampliamente soportado y muy compatible<\/strong> con scripts y herramientas del sistema.<\/li>\n\n\n\n<li>Mejores resultados en archivos de texto y c\u00f3digo fuente.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udcc8 \u00bfD\u00f3nde se usa <code>.tar.gz<\/code>?<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Distribuciones de software en Linux (como c\u00f3digo fuente: <code>programa.tar.gz<\/code>).<\/li>\n\n\n\n<li>Backups automatizados de servidores.<\/li>\n\n\n\n<li>Archivos de logs comprimidos (<code>logfile.log.gz<\/code>).<\/li>\n\n\n\n<li>En proyectos de c\u00f3digo abierto para entregar versiones.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udca1 Otras variantes relacionadas<\/h2>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Formato<\/th><th>Descripci\u00f3n<\/th><th>Compresor usado<\/th><\/tr><\/thead><tbody><tr><td><code>.tar<\/code><\/td><td>Solo empaqueta, sin compresi\u00f3n<\/td><td>Ninguno<\/td><\/tr><tr><td><code>.tar.gz<\/code><\/td><td>Empaqueta + comprime con gzip<\/td><td>Gzip<\/td><\/tr><tr><td><code>.tgz<\/code><\/td><td>Alias corto para <code>.tar.gz<\/code><\/td><td>Gzip<\/td><\/tr><tr><td><code>.tar.bz2<\/code><\/td><td>M\u00e1s compresi\u00f3n, m\u00e1s lento<\/td><td>Bzip2<\/td><\/tr><tr><td><code>.tar.xz<\/code><\/td><td>Mejor compresi\u00f3n, m\u00e1s lento a\u00fan<\/td><td>XZ<\/td><\/tr><tr><td><code>.tar.zst<\/code><\/td><td>Muy buena compresi\u00f3n y velocidad<\/td><td>Zstandard<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">\u2705 Ventajas de <code>.tar.gz<\/code><\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Est\u00e1ndar en Linux y Unix.<\/li>\n\n\n\n<li>R\u00e1pido y ligero.<\/li>\n\n\n\n<li>Mantiene estructura, permisos y metadatos.<\/li>\n\n\n\n<li>Compatible con casi todos los entornos y scripts.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">\u274c Desventajas<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>No permite compresi\u00f3n por archivo (solo del <code>.tar<\/code> completo).<\/li>\n\n\n\n<li>No tan eficiente como <code>.xz<\/code>, <code>.zst<\/code> o <code>.7z<\/code>.<\/li>\n\n\n\n<li>No soporta recuperaci\u00f3n de errores como <code>.rar<\/code>.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83e\uddea Pro tip: ver contenido sin extraer<\/h2>\n\n\n\n<pre class=\"wp-block-code\"><code>tar -tzvf archivo.tar.gz<\/code><\/pre>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udee0\ufe0f Alternativas modernas<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong><code>.tar.zst<\/code> con Zstandard<\/strong>: mejor compresi\u00f3n y velocidad que gzip.<\/li>\n\n\n\n<li><strong><code>.zip<\/code><\/strong>: m\u00e1s usado en Windows, pero menos eficiente.<\/li>\n\n\n\n<li><strong><code>.7z<\/code><\/strong>: mejor compresi\u00f3n, pero menos compatible por defecto en Linux.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><\/h2>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83d\udcc8 Aplicaciones modernas de la compresi\u00f3n<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Bases de datos<\/strong>: MySQL, RocksDB usan LZ4, Zstd.<\/li>\n\n\n\n<li><strong>Transmisi\u00f3n en vivo<\/strong>: Twitch, YouTube usan AV1, Opus.<\/li>\n\n\n\n<li><strong>Sistemas operativos<\/strong>: Android usa Brotli y Zstd.<\/li>\n\n\n\n<li><strong>Web<\/strong>: HTTP\/2 y HTTP\/3 soportan compresi\u00f3n Brotli y Gzip.<\/li>\n\n\n\n<li><strong>Sistemas de archivos<\/strong>: <code>btrfs<\/code>, <code>ZFS<\/code>, <code>f2fs<\/code> con soporte nativo de compresi\u00f3n.<\/li>\n<\/ul>\n\n\n\n<p>El <strong>algoritmo de compresi\u00f3n de datos m\u00e1s poderoso del mundo<\/strong> actualmente depende del tipo de datos y del prop\u00f3sito (texto, im\u00e1genes, audio, video, datos cient\u00edficos, etc.). Sin embargo, si hablamos de <strong>compresi\u00f3n sin p\u00e9rdida<\/strong> (lossless) y en t\u00e9rminos de <strong>eficiencia y compresi\u00f3n m\u00e1xima<\/strong>, los contendientes m\u00e1s avanzados son:<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udd1d <strong>CMIX<\/strong> \u2013 <em>El algoritmo m\u00e1s poderoso (pero lento)<\/em><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Tipo<\/strong>: Compresi\u00f3n sin p\u00e9rdida (lossless)<\/li>\n\n\n\n<li><strong>Creador<\/strong>: Byron Knoll<\/li>\n\n\n\n<li><strong>A\u00f1o<\/strong>: 2011 (en adelante, sigue en desarrollo)<\/li>\n\n\n\n<li><strong>Caracter\u00edsticas<\/strong>:\n<ul class=\"wp-block-list\">\n<li>Logra compresi\u00f3n <strong>superior a cualquier otro algoritmo conocido p\u00fablicamente<\/strong>.<\/li>\n\n\n\n<li>Usa redes neuronales, modelos estad\u00edsticos y m\u00faltiples predictores.<\/li>\n\n\n\n<li>Muy lento y consume muchos recursos (RAM y CPU).<\/li>\n\n\n\n<li>No apto para uso cotidiano o en tiempo real.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>D\u00f3nde se usa<\/strong>:\n<ul class=\"wp-block-list\">\n<li><strong>Investigaci\u00f3n acad\u00e9mica<\/strong>, competiciones de compresi\u00f3n (como el Hutter Prize).<\/li>\n\n\n\n<li>No se usa en aplicaciones comerciales por su lentitud.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udd48 <strong>ZPAQ<\/strong> \u2013 <em>Alta compresi\u00f3n con uso pr\u00e1ctico<\/em><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Tipo<\/strong>: Lossless, journaling archive<\/li>\n\n\n\n<li><strong>Creador<\/strong>: Matt Mahoney<\/li>\n\n\n\n<li><strong>Usos<\/strong>:\n<ul class=\"wp-block-list\">\n<li>Ideal para backups incrementales con alta compresi\u00f3n.<\/li>\n\n\n\n<li>Utiliza predicci\u00f3n por contexto, como PAQ pero optimizado.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>D\u00f3nde se usa<\/strong>:\n<ul class=\"wp-block-list\">\n<li>Archivos de respaldo, sistemas donde la compresi\u00f3n pesa m\u00e1s que la velocidad.<\/li>\n\n\n\n<li>Archivos tipo <code>.zpaq<\/code> en entornos t\u00e9cnicos o personalizados.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udd49 <strong>Zstandard (Zstd)<\/strong> \u2013 <em>Equilibrio entre compresi\u00f3n y velocidad<\/em><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Tipo<\/strong>: Lossless<\/li>\n\n\n\n<li><strong>Creador<\/strong>: Yann Collet (Facebook)<\/li>\n\n\n\n<li><strong>A\u00f1o<\/strong>: 2016<\/li>\n\n\n\n<li><strong>Caracter\u00edsticas<\/strong>:\n<ul class=\"wp-block-list\">\n<li>Muy r\u00e1pido y eficiente.<\/li>\n\n\n\n<li>Mejor compresi\u00f3n que zlib\/gzip y m\u00e1s r\u00e1pido.<\/li>\n\n\n\n<li>Soporta niveles de compresi\u00f3n ajustables y diccionarios preentrenados.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>D\u00f3nde se usa<\/strong>:\n<ul class=\"wp-block-list\">\n<li><strong>Facebook, Linux kernel, Git<\/strong>, paquetes <code>.deb<\/code> y <code>.rpm<\/code>, compresi\u00f3n en discos (<code>btrfs<\/code>), <code>zstd<\/code> en <code>tar<\/code>, etc.<\/li>\n\n\n\n<li>Uno de los est\u00e1ndares modernos m\u00e1s adoptados.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udce6 Otros algoritmos destacados seg\u00fan uso:<\/h3>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Tipo de datos<\/th><th>Algoritmo m\u00e1s poderoso<\/th><th>Usos comunes<\/th><\/tr><\/thead><tbody><tr><td><strong>Texto puro<\/strong><\/td><td>PAQ8 \/ CMIX<\/td><td>Competiciones, backup<\/td><\/tr><tr><td><strong>Video<\/strong><\/td><td>AV1 (mejor que H.265\/HEVC)<\/td><td>YouTube, Netflix, streaming<\/td><\/tr><tr><td><strong>Audio<\/strong><\/td><td>FLAC (lossless), Opus (lossy)<\/td><td>Archivos master, voz<\/td><\/tr><tr><td><strong>Imagen<\/strong><\/td><td>JPEG XL (mejor que JPEG\/PNG\/WebP)<\/td><td>Google, Kodak, investigaci\u00f3n<\/td><\/tr><tr><td><strong>Bases de datos<\/strong><\/td><td>LZ4, Zstd, Snappy<\/td><td>MySQL, Cassandra, RocksDB<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 \u00bfPor qu\u00e9 no se usa siempre el algoritmo m\u00e1s potente?<\/h3>\n\n\n\n<p>Porque <strong>hay un equilibrio entre compresi\u00f3n, velocidad y consumo de recursos<\/strong>. Algoritmos como <strong>CMIX o PAQ8<\/strong> pueden comprimir mejor que ZIP o Zstandard, pero requieren <strong>muchas horas y gigabytes de RAM<\/strong> para procesar archivos grandes.<\/p>\n\n\n\n<p>En la pr\u00e1ctica:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Zstandard<\/strong> es el favorito por su rendimiento general.<\/li>\n\n\n\n<li><strong>CMIX<\/strong> y <strong>PAQ<\/strong> son los campeones te\u00f3ricos.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">\ud83c\udfc1 Conclusi\u00f3n<\/h2>\n\n\n\n<p>Desde el c\u00f3digo Morse hasta Zstandard, los algoritmos de compresi\u00f3n han sido <strong>herramientas esenciales<\/strong> para superar las limitaciones f\u00edsicas del almacenamiento y la transmisi\u00f3n de datos.<\/p>\n\n\n\n<p>La historia de la compresi\u00f3n es tambi\u00e9n la historia de c\u00f3mo aprendimos a <strong>ser m\u00e1s inteligentes con menos espacio<\/strong>, a transmitir ideas m\u00e1s r\u00e1pido, y a construir un mundo digital m\u00e1s eficiente.<\/p>\n\n\n\n<p>Y aunque cada d\u00eda los discos crecen y las redes se aceleran, la compresi\u00f3n sigue siendo <strong>una de las joyas invisibles de la inform\u00e1tica moderna<\/strong>.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>\u00bfQuieres ahorrar espacio? Agradece a la compresi\u00f3n.<br>\u00bfQuieres compartir datos m\u00e1s r\u00e1pido? Agradece a la compresi\u00f3n.<br>\u00bfQuieres vivir en la nube? No podr\u00edas sin ella.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La necesidad de comprimir informaci\u00f3n es tan antigua como la<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0,"footnotes":""},"categories":[2379],"tags":[11488,11497,11494,11489,11490,5109,11487,11491,11498,11501,11499,5116,11504,11493,11500,11503,11496,11492,5117,11495,11502],"class_list":["post-4182","post","type-post","status-publish","format-standard","hentry","category-software","tag-algoritmo-rar","tag-algoritmos-de-compresion-modernos","tag-archivos-divididos","tag-cmix","tag-compresion-con-perdida","tag-compresion-de-archivos","tag-compresion-de-datos","tag-compresion-sin-perdida","tag-compresion-solida","tag-compresion-zip","tag-entropia-de-la-informacion","tag-eugene-roshal","tag-formatos-de-archivo","tag-historia-de-la-compresion","tag-huffman-coding","tag-lz77","tag-paq","tag-software-propietario","tag-winrar","tag-winrar-licencia","tag-zstandard"],"_links":{"self":[{"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/posts\/4182","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/comments?post=4182"}],"version-history":[{"count":5,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/posts\/4182\/revisions"}],"predecessor-version":[{"id":4191,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/posts\/4182\/revisions\/4191"}],"wp:attachment":[{"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/media?parent=4182"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/categories?post=4182"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/zidrave.net\/index.php\/wp-json\/wp\/v2\/tags?post=4182"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}