Compresión y archivo de datos

Aunque los sistemas informáticos modernos tienen un almacenamiento de cada vez mayor capacidad, el crecimiento de los datos que se producen es implacable. Algoritmos de compresión sin pérdida compensan parte del déficit en la capacidad trocando el tiempo dedicado a comprimir o descomprimir datos por el espacio necesario para almacenarlos. Python incluye interfaces para las bibliotecas de compresión más populares para que se pueda leer y escribir archivos de forma intercambiable.

zlib y gzip exponen la librería zip de GNU, y bz2 proporciona acceso al formato zip2 más reciente. Ambos formatos funcionan en flujos de datos, sin importar el formato de entrada, y proporcionan interfaces para leer y escribir archivos comprimidos de forma transparente. Usa estos módulos para comprimir un archivo o una fuente de datos.

La biblioteca estándar también incluye módulos para administrar formatos archivo, para combinar varios archivos en un sólo archivo que puede ser manejado como una unidad. tarfile lee y escribe el formato de archivo cinta Unix, un viejo estándar todavía ampliamente utilizado en la actualidad debido a su flexibilidad. zipfile funciona con archivos basados en el formato popularizado por el programa de PC PKZIP, originalmente utilizado bajo MS-DOS y Windows, pero ahora también se usa en otras plataformas debido a la simplicidad de su interfaz y la portabilidad del formato.