Pudiera darse el caso de que encuentres algún fallo con tu código o proyecto, recuerda probar siempre en un ambiente de testing antes añadir el código al trabajo final.
Solución:
Para descomprimir un archivo en formato gzip con zlib, llame inflateInit2
con el windowBits
parámetro como 16+MAX_WBITS
como esto:
inflateInit2(&stream, 16+MAX_WBITS);
Si no hace esto, zlib se quejará de un formato de transmisión incorrecto. De forma predeterminada, zlib crea secuencias con un encabezado zlib y, al inflar, no reconoce el encabezado gzip diferente a menos que se lo indique. Aunque esto está documentado a partir de la versión 1.2.1 del zlib.h
archivo de encabezado, no está en el manual de zlib. Desde el archivo de encabezado:
windowBits
también puede ser mayor que 15 para la decodificación gzip opcional. Suma 32 awindowBits
para habilitar la decodificación de zlib y gzip con detección automática de encabezado, o agregue 16 para decodificar solo el formato gzip (el formato zlib devolverá unZ_DATA_ERROR
). Si se está decodificando un flujo gzip,strm->adler
es un crc32 en lugar de un adler32.
pitón
zlib
la biblioteca admite:
- RFC 1950 (
zlib
formato comprimido) - RFC 1951 (
deflate
formato comprimido) - RFC 1952 (
gzip
formato comprimido)
la pitón zlib
El módulo también los admitirá.
elegir ventanaBits
Pero zlib
puede descomprimir todos esos formatos:
- (des)comprimir
deflate
formato, usowbits = -zlib.MAX_WBITS
- (des)comprimir
zlib
formato, usowbits = zlib.MAX_WBITS
- (des)comprimir
gzip
formato, usowbits = zlib.MAX_WBITS | 16
Consulte la documentación en http://www.zlib.net/manual.html#Advanced (sección inflateInit2
)
ejemplos
datos de prueba:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>>
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>
prueba obvia para zlib
:
>>> zlib.decompress(zlib_data)
'test'
hacer una prueba por deflate
:
>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
File "", line 1, in
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
hacer una prueba por gzip
:
>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
File "", line 1, in
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
los datos también son compatibles con gzip
módulo:
>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
detección automática de encabezado (zlib o gzip)
agregando 32
a windowBits
activará la detección de encabezado
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
usando gzip
en cambio
Para gzip
datos con encabezado gzip que puede usar gzip
módulo directamente; pero por favor recuerda que debajo del capó, gzip
usos zlib
.
fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
La estructura de zlib y gzip es diferente. zlib usa RFC 1950 y gzip usa RFC 1952, por lo que tienen encabezados diferentes pero el resto tiene la misma estructura y sigue el RFC 1951.