Saltar al contenido

¿Cómo puedo descomprimir una transmisión gzip con zlib?

Pudiera darse el caso de que encuentres algún fallo con tu código o proyecto, recuerda probar siempre en un ambiente de testing antes añadir el código al trabajo final.

Solución:

Para descomprimir un archivo en formato gzip con zlib, llame inflateInit2 con el windowBits parámetro como 16+MAX_WBITScomo esto:

inflateInit2(&stream, 16+MAX_WBITS);

Si no hace esto, zlib se quejará de un formato de transmisión incorrecto. De forma predeterminada, zlib crea secuencias con un encabezado zlib y, al inflar, no reconoce el encabezado gzip diferente a menos que se lo indique. Aunque esto está documentado a partir de la versión 1.2.1 del zlib.h archivo de encabezado, no está en el manual de zlib. Desde el archivo de encabezado:

windowBits también puede ser mayor que 15 para la decodificación gzip opcional. Suma 32 a windowBits para habilitar la decodificación de zlib y gzip con detección automática de encabezado, o agregue 16 para decodificar solo el formato gzip (el formato zlib devolverá un Z_DATA_ERROR). Si se está decodificando un flujo gzip, strm->adler es un crc32 en lugar de un adler32.

pitón

zlib la biblioteca admite:

  • RFC 1950 (zlib formato comprimido)
  • RFC 1951 (deflate formato comprimido)
  • RFC 1952 (gzip formato comprimido)

la pitón zlib El módulo también los admitirá.

elegir ventanaBits

Pero zlib puede descomprimir todos esos formatos:

  • (des)comprimir deflate formato, uso wbits = -zlib.MAX_WBITS
  • (des)comprimir zlib formato, uso wbits = zlib.MAX_WBITS
  • (des)comprimir gzip formato, uso wbits = zlib.MAX_WBITS | 16

Consulte la documentación en http://www.zlib.net/manual.html#Advanced (sección inflateInit2)

ejemplos

datos de prueba:

>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>> 
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>> 

prueba obvia para zlib:

>>> zlib.decompress(zlib_data)
'test'

hacer una prueba por deflate:

>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
  File "", line 1, in 
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'

hacer una prueba por gzip:

>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
  File "", line 1, in 
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'

los datos también son compatibles con gzip módulo:

>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()

detección automática de encabezado (zlib o gzip)

agregando 32 a windowBits activará la detección de encabezado

>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'

usando gzip en cambio

Para gzip datos con encabezado gzip que puede usar gzip módulo directamente; pero por favor recuerda que debajo del capó, gzip usos zlib.

fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()

La estructura de zlib y gzip es diferente. zlib usa RFC 1950 y gzip usa RFC 1952, por lo que tienen encabezados diferentes pero el resto tiene la misma estructura y sigue el RFC 1951.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *