“Conocimiento software>compresión de datos

¿Cómo afecta la compresión de archivos a TXT?

2015/7/31
La compresión del archivo afecta los archivos TXT (archivos de texto sin formato) reduciendo su tamaño. Esto se logra explotando redundancias y patrones dentro de los datos de texto. Los diferentes algoritmos de compresión logran esto de varias maneras, pero el principio general sigue siendo el mismo:

* Compresión sin pérdidas: Este es el tipo más común utilizado para archivos TXT. Los algoritmos de compresión sin pérdidas garantizan que el texto original se reconstruirá perfectamente después de la descompresión. Funcionan identificando patrones de repetición, secuencias de caracteres u otros datos predecibles y reemplazándolos con códigos más cortos. Los ejemplos incluyen:

* LZ77/LZ78 y sus derivados (por ejemplo, zip, gzip, 7z): Estos algoritmos encuentran secuencias repetidas y las reemplazan con punteros a ocurrencias anteriores, reduciendo efectivamente la redundancia.

* Codificación de Huffman: Este algoritmo asigna códigos más cortos a caracteres más frecuentes y códigos más largos a los menos frecuentes, reduciendo el tamaño general.

* bzip2: Este algoritmo utiliza una transformación de vehículo de madriguera para reorganizar los datos antes de aplicar la codificación de Huffman, lo que resulta en relaciones de compresión más altas.

* Compresión con pérdida: Este tipo de compresión se usa * no * típicamente para archivos TXT. Las técnicas de compresión con pérdida descartan alguna información para lograr una mayor reducción del tamaño. Dado que descartar información en un archivo de texto alteraría su significado, esto no es práctico. Los ejemplos de compresión con pérdida (que no son adecuadas para TXT) incluyen JPEG para imágenes y MP3 para audio.

¿Cuánta compresión se logra?

La cantidad de compresión lograda en un archivo txt depende de varios factores:

* El tamaño del archivo original: Los archivos más grandes generalmente tienen más oportunidades de redundancia, lo que permite relaciones de compresión más altas.

* El contenido del archivo: El texto altamente repetitivo, como el código con bloques repetidos o un documento con muchas frases repetidas, se comprimirá mejor que el texto altamente aleatorio (como una cadena de caracteres verdaderamente aleatoria).

* El algoritmo de compresión: Diferentes algoritmos tienen diferentes eficiencias. BZIP2 generalmente logra una mayor compresión que GZIP, pero a costa de la compresión y las velocidades de descompresión más lentas.

En resumen, la compresión de archivos para archivos TXT los hace más pequeños para el almacenamiento y la transmisión sin perder ningún dato. La extensión de la reducción del tamaño depende de la estructura inherente del texto y del algoritmo de compresión elegido.

compresión de datos
¿Cuál es lo siguiente proporciona la tasa de transferencia de datos más rápida?
Cómo comprimir archivos antiguos
Cómo extraer los archivos Zip divididos
Cómo comprimir drásticamente archivos AVI a MPEG AVI
Cómo cargar una unidad Zip externa
¿Cómo puedo abrir un archivo Zip en el PC
Cómo comprimir un archivo PDF con Adobe
¿Qué es una carpeta zip
Conocimiento de la computadora © http://www.ordenador.online