tecnologías de compresión de archivos

16
-Tecnologías de compresión de datos -Armando Rodriguez 2013 Introducción a la Informática

Upload: armando-rodriguez

Post on 03-Aug-2015

202 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tecnologías de compresión de archivos

-Tecnologías de compresión de datos

-Armando Rodriguez

2013

Introducción a la Informática

Page 2: Tecnologías de compresión de archivos

En que consiste una compresión de

datos *La compresión de datos consiste en la reducción del volumen de información tratable (procesar, transmitir o grabar). En principio, con la compresión se pretende transportar la misma información, pero empleando la menor cantidad de espacio. 

Page 3: Tecnologías de compresión de archivos

En que consiste una compresión de

datos *La compresión de datos se basa

fundamentalmente en buscar repeticiones en series de datos para después almacenar solo el dato junto al número de veces que se repite. Así, por ejemplo, si en un fichero aparece una secuencia como “AAAAAA”, ocupando 6 bytes se podría almacenar simplemente “6A” que ocupa solo 2 bytes, en algoritmo RLE. 

En realidad, el proceso es mucho más complejo, ya que raramente se consigue encontrar patrones de repetición tan exactos (salvo en algunas imágenes)

Page 4: Tecnologías de compresión de archivos

Algoritmos de compresión

*Por un lado, algunos buscan series largas que luego codifican en formas más breves. Por otro lado, algunos algoritmos, como el algoritmo de Huffman, examinan los caracteres más repetidos para luego codificar de forma más corta los que más se repiten. Otros, como el LZW, construyen un diccionario con los patrones encontrados, a los cuales se hace referencia de manera posterior. También esta una forma de comprimir que es codificando los bytes pares es muy sencillo y fácil de entender. 

Page 5: Tecnologías de compresión de archivos

Algoritmos de compresion

*A la hora de hablar de compresión hay que tener presentes dos conceptos: Redundancia: Datos que son repetitivos o previsibles Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia. 

Page 6: Tecnologías de compresión de archivos

Compresión con y sin pérdida

* El objetivo de la codificación es siempre reducir el tamaño de la información, intentando que esta reducción de tamaño no afecte al contenido. No obstante, la reducción de datos puede afectar o no a la calidad de la información: Compresión sin pérdida: los datos antes y después de comprimirlos son exactos en la compresión sin pérdida. En el caso de la compresión sin pérdida una mayor compresión solo implica más tiempo de proceso. Se utiliza principalmente en la compresión de texto. Un algoritmo de compresión con pérdida puede eliminar datos para reducir aún más el tamaño, con lo que se suele reducir la calidad. Hay que tener en cuenta que una vez realizada la compresión, no se puede obtener la señal original, aunque sí una aproximación cuya semejanza con la original dependerá del tipo de compresión. Se utiliza principalmente en la compresión de imágenes, videos y sonidos. 

Page 7: Tecnologías de compresión de archivos

Programas mas utilizados para la

compresión de datos

Page 8: Tecnologías de compresión de archivos

Winrar

Es un potente programa compresor y descompresor de datos multi-función, una herramienta indispensable para ahorrar espacio de almacenamiento y tiempo de transmisión al enviar y recibir archivos a través de Internet o al realizar copias de seguridad.

Page 9: Tecnologías de compresión de archivos

*RAR utiliza un algoritmo de compresión sin perdida basado en el LZSS, una mejora del LZ77, descrito en 1982 por James Storer y Thomas Szymanski.

*Rar es además el primer compresor que integra completamente la compresión a través de ficheros, conocido por compresión sólida. Esta tecnológia comprime varios ficheros juntos de forma que el mismo diccionario se aplica a todos los ficheros, consiguiendo asi una relación de compresión superior.

Winrar

Page 10: Tecnologías de compresión de archivos

*7-Zip es un archivador de ficheros libre desarrollado por Igor Pavlov. Por defecto utiliza el formato de archivo 7z, también libre, (con extensión.7z). Este formato usa los métodos de compresión LZMA y PPMD (más adecuado para textos), desarrollados por su autor, y puede aplicar un filtro a los ejecutables para aumentar su compresibilidad. Los archivos 7z pueden ser sólidos, a diferencia de los ZIP, lo que mejora la compresión de conjuntos de archivos pequeños.

7zip

Page 11: Tecnologías de compresión de archivos

7zip

*7zip utiliza su propia extension llamado 7z. Es el formato predeterminado para 7-zip, utiliza la extensión 7z. Cada archivo en formato 7z puede contener directorios y archivos. Como es un formato de compresión, la seguridad y el tamaño se logran usando una combinación de filtros,como pueden ser; pre-procesadores, algoritmos de compresión y los filtros de cifrado.

*.7z usa una variedad de algoritmos de compresión, los más comunes son bzip2, LZMA2 y LZMA. Desarrollado por Pavlov, LZMA es una gran algoritmo de compresión, con un gran radio de compresión y un diccionario de hasta 4 GB.

Page 12: Tecnologías de compresión de archivos

KGB Archiver

*KGB Archiver es un programa libre de compresión de ficheros creado por Tomasz Pawlak.

*KGB Archiver es una herramienta para comprimir y descomprimir ficheros con tasas de compresión muy altas. Supera ampliamente a otras utilidades similares, como 7zip o UHarc.

*La contrapartida a las grandes tasas de compresión que consigue, es que necesita mucho más tiempo y memoria RAM para comprimir los ficheros. El autor recomienda como mínimo un procesador con 1,5 GHz de frecuencia de reloj y 256 MB de RAM.

Page 13: Tecnologías de compresión de archivos

KGB Archiver

*Una de las ventajas de KGB Archiver es su algoritmo de compresión, PAQ7 (lanzado en diciembre de 2005, habiendo versiones posteriores como PAQ8, que podrían ser usadas en el futuro). Este algoritmo ha logrado el premio Hutter, premio que recompensa los desarrollos en compresión de datos sin pérdida. También usa AES-256 para cifrar archivos. Este es uno de los algoritmos de cifrado más poderosos que se conocen.

Page 14: Tecnologías de compresión de archivos

WINZIP

*WinZip es un compresor de archivos comercial que funciona en Microsoft Windows, desarrollado por WinZip Computing (antes conocido como Nico Mak Computing). Puede manejar varios formatos de archivo adicionales. Es un producto comercial con una versión de evaluación gratuita.

*WinZip comenzó su vida a principios de los años 1990, como una interfaz gráfica de usuario para PKZIP, con licencia shareware. En 1996, los creadores de WinZip incorporaron código de compresión del proyecto Info-ZIP, haciendo que no fuera necesario el ejecutable PKZIP.

Page 15: Tecnologías de compresión de archivos

WINZIP

* El tipo de fichero por default es “.zip”. ZIP es un formato de fichero bastante simple, que comprime cada uno de los archivos de forma separada. Comprimir cada archivo independientemente del resto de archivos comprimidos permite recuperar cada uno de los ficheros sin tener que leer el resto, lo que aumenta el rendimiento. El problema, es que el resultado de agrupar un número grande de pequeños archivos es siempre mayor que agrupar todos los archivos y comprimirlos como si fuera uno sólo. A cambio, esto permite extraer cada archivo de forma independiente sin tener que procesar el archivo desde el principio.

* La especificación de ZIP indica que cada archivo puede ser almacenado, o bien sin comprimir, o utilizando una amplia variedad de algoritmos de compresión. Sin embargo, en la práctica, ZIP se suele utilizar casi siempre con el algoritmo de Phil Katz.

Page 16: Tecnologías de compresión de archivos

Gracias