Compresión y archivo de datos¶
Aunque los sistemas informáticos modernos tienen un almacenamiento de cada vez mayor capacidad, el crecimiento de los datos que se producen es implacable. Algoritmos de compresión sin pérdida compensan parte del déficit en la capacidad trocando el tiempo dedicado a comprimir o descomprimir datos por el espacio necesario para almacenarlos. Python incluye interfaces para las bibliotecas de compresión más populares para que se pueda leer y escribir archivos de forma intercambiable.
zlib
y gzip
exponen la librería zip de GNU, y bz2
proporciona acceso al formato zip2 más reciente. Ambos formatos funcionan en
flujos de datos, sin importar el formato de entrada, y proporcionan interfaces
para leer y escribir archivos comprimidos de forma transparente. Usa estos
módulos para comprimir un archivo o una fuente de datos.
La biblioteca estándar también incluye módulos para administrar formatos
archivo, para combinar varios archivos en un sólo archivo que puede ser
manejado como una unidad. tarfile
lee y escribe el formato de archivo
cinta Unix, un viejo estándar todavía ampliamente utilizado en la actualidad
debido a su flexibilidad. zipfile
funciona con archivos basados en el
formato popularizado por el programa de PC PKZIP, originalmente utilizado bajo
MS-DOS y Windows, pero ahora también se usa en otras plataformas debido a la
simplicidad de su interfaz y la portabilidad del formato.