No dudes en divulgar nuestro espacio y códigos con tus amigos, danos de tu ayuda para ampliar esta comunidad.
Solución:
La parte confusa es encajar y transformar.
#here fit method will calculate the required parameters (In this case mean)
#and store it in the impute object
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3]=imputer.transform(X[:, 1:3])
#imputer.transform will actually do the work of replacement of nan with mean.
#This can be done in one step using fit_transform
Imputer se utiliza para reemplazar los valores que faltan. El método fit calcula los parámetros mientras que el método fit_transform cambia los datos para reemplazar esos NaN con la media y genera una nueva matriz X.
# Imports library
from sklearn.preprocessing import Imputer
# Create a new instance of the Imputer object
# Missing values are replaced with NaN
# Missing values are replaced by the mean later on
# The axis determines whether you want to move column or row wise
imputer = Imputer(missing_values='NaN', strategy='mean',axis=0)
# Fit the imputer to X
imputer = imputer.fit(X[:, 1:3])
# Replace in the original matrix X
# with the new values after the transformation of X
X[:, 1:3]=imputer.transform(X[:, 1:3])
Comenté el código para ti, espero que esto tenga un poco más de sentido. Debe pensar en X como una matriz que debe transformar para no tener más NaN (valores faltantes).
Consulte la documentación para obtener más información.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)