Solución:
Esta stratify
El parámetro hace una división de modo que la proporción de valores en la muestra producida sea la misma que la proporción de valores proporcionados al parámetro stratify
.
Por ejemplo, si variable y
es una variable categórica binaria con valores 0
y 1
y hay un 25% de ceros y un 75% de unos, stratify=y
se asegurará de que su división aleatoria tenga el 25% de 0
y el 75% de 1
‘s.
Para mi yo futuro que viene aquí a través de Google:
train_test_split
está ahora en model_selection
, por eso:
from sklearn.model_selection import train_test_split
# given:
# features: xs
# ground truth: ys
x_train, x_test, y_train, y_test = train_test_split(xs, ys,
test_size=0.33,
random_state=0,
stratify=ys)
es la forma de utilizarlo. Establecer el random_state
es deseable para la reproducibilidad.
Scikit-Learn simplemente le está diciendo que no reconoce el argumento “estratificar”, no que lo esté usando incorrectamente. Esto se debe a que el parámetro se agregó en la versión 0.17 como se indica en la documentación que citó.
Así que solo necesitas actualizar Scikit-Learn.