Saltar al contenido

Parámetro “estratificar” del método “train_test_split” (scikit Learn)

Solución:

Esta stratify El parámetro hace una división de modo que la proporción de valores en la muestra producida sea la misma que la proporción de valores proporcionados al parámetro stratify.

Por ejemplo, si variable y es una variable categórica binaria con valores 0 y 1 y hay un 25% de ceros y un 75% de unos, stratify=y se asegurará de que su división aleatoria tenga el 25% de 0y el 75% de 1‘s.

Para mi yo futuro que viene aquí a través de Google:

train_test_split está ahora en model_selection, por eso:

from sklearn.model_selection import train_test_split

# given:
# features: xs
# ground truth: ys

x_train, x_test, y_train, y_test = train_test_split(xs, ys,
                                                    test_size=0.33,
                                                    random_state=0,
                                                    stratify=ys)

es la forma de utilizarlo. Establecer el random_state es deseable para la reproducibilidad.

Scikit-Learn simplemente le está diciendo que no reconoce el argumento “estratificar”, no que lo esté usando incorrectamente. Esto se debe a que el parámetro se agregó en la versión 0.17 como se indica en la documentación que citó.

Así que solo necesitas actualizar Scikit-Learn.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *