Ver fuente en GitHub

Secuencias de almohadillas de la misma longitud.

Ver alias

Alias ​​de compatibilidad para la migración

Ver Guía de migración para más detalles.

tf.compat.v1.keras.preprocessing.sequence.pad_sequences

tf.keras.preprocessing.sequence.pad_sequences(
    sequences, maxlen=None, dtype='int32', padding='pre',
    truncating='pre', value=0.0)

Esta función transforma una lista (de longitud num_samples) de secuencias (listas de números enteros) en un Numpy 2D array de forma (num_samples, num_timesteps). num_timesteps es el maxlen argumento si se proporciona, o la longitud de la secuencia más larga de la lista.

Secuencias que son más cortas que num_timesteps están acolchados con value hasta que estén num_timesteps largo.

Secuencias más largas que num_timesteps se truncan para que se ajusten a la longitud deseada.

La posición donde ocurre el relleno o el truncamiento está determinada por los argumentos padding y truncating, respectivamente. El relleno previo o la eliminación de valores desde el comienzo de la secuencia es el valor predeterminado.

sequence =[[1],[2,3],[4,5,6]]
tf.keras.preprocessing.sequence.pad_sequences(sequence)
array([[0,0,1],[0,2,3],[4,5,6]], dtype=int32)
tf.keras.preprocessing.sequence.pad_sequences(sequence, value=-1)
array([[-1,-1,1],[-1,2,3],[4,5,6]], dtype=int32)
tf.keras.preprocessing.sequence.pad_sequences(sequence, padding='post')
array([[1,0,0],[2,3,0],[4,5,6]], dtype=int32)
tf.keras.preprocessing.sequence.pad_sequences(sequence, maxlen=2)
array([[0,1],[2,3],[5,6]], dtype=int32)
Argumentos
sequences Lista de secuencias (cada secuencia es una lista de enteros).
maxlen Int opcional, longitud máxima de todas las secuencias. Si no se proporciona, las secuencias se rellenarán con la longitud de la secuencia individual más larga.
dtype (Opcional, por defecto es int32). Tipo de las secuencias de salida. Para rellenar secuencias con cadenas de longitud variable, puede usar object.
padding Cadena, ‘pre’ o ‘post’ (opcional, por defecto es ‘pre’): relleno antes o después de cada secuencia.
truncating Cadena, ‘pre’ o ‘post’ (opcional, el valor predeterminado es ‘pre’): elimine valores de secuencias mayores que maxlenya sea al principio o al final de las secuencias.
value Flotante o Cadena, valor de relleno. (Opcional, el valor predeterminado es 0).
Devoluciones
entumecido array con forma (len(sequences), maxlen)
aumenta
ValueError En caso de valores inválidos para truncating o paddingo en caso de forma no válida para un sequences entrada.