Gloria, parte de nuestro equipo, nos hizo el favor de redactar este artículo ya que domina a la perfección el tema.
class sklearn.feature_selection.VarianceThreshold(threshold=0.0)
[source]-
Selector de funciones que elimina todas las funciones de baja variación.
Este algoritmo de selección de características solo mira las características (X), no las salidas deseadas (y), y por lo tanto se puede usar para el aprendizaje no supervisado.
Leer más en el Guía del usuario.
- Parámetros
-
thresholdfloat, default=0
-
Se eliminarán las funciones con una variación del conjunto de entrenamiento inferior a este umbral. El valor predeterminado es mantener todas las características con una variación distinta de cero, es decir, eliminar las características que tienen el mismo valor en todas las muestras.
- Atributos
-
variances_array, shape (n_features,)
-
Variaciones de características individuales.
Notas
Permite NaN en la entrada. Aumenta ValueError si ninguna característica en X alcanza el umbral de variación.
Ejemplos de
El siguiente conjunto de datos tiene características enteras, dos de las cuales son iguales en cada muestra. Estos se eliminan con la configuración predeterminada para el umbral:
>>> X =[[0,2,0,3],[0,1,4,3],[0,1,1,3]]>>> selector = VarianceThreshold()>>> selector.fit_transform(X) array([[2,0],[1,4],[1,1]])
Métodos
fit
(X[, y])Aprenda las variaciones empíricas de X.
fit_transform
(X[, y])Ajústelos a los datos y luego transfórmelos.
get_params
([deep])Obtenga parámetros para este estimador.
get_support
([indices])Obtenga una máscara, o índice entero, de las características seleccionadas
inverse_transform
(X)Invertir la operación de transformación
set_params
(** parámetros)Establezca los parámetros de este estimador.
transform
(X)Reducir X a las características seleccionadas.
fit(X, y=None)
[source]-
Aprenda las variaciones empíricas de X.
- Parámetros
-
Xarray-like, sparse matrix, shape (n_samples, n_features)
-
Vectores de muestra a partir de los cuales calcular las varianzas.
yany, default=None
-
Ignorado. Este parámetro existe solo por compatibilidad con sklearn.pipeline.Pipeline.
- Devoluciones
-
- uno mismo
fit_transform(X, y=None, **fit_params)
[source]-
Ajústelos a los datos y luego transfórmelos.
Se adapta al transformador
X
yy
con parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
-
Xarray-like of shape (n_samples, n_features)
-
Muestras de entrada.
yarray-like of shape (n_samples,) or (n_samples, n_outputs), default=None
-
Valores objetivo (Ninguno para transformaciones no supervisadas).
**fit_paramsdict
-
Parámetros de ajuste adicionales.
- Devoluciones
-
X_newndarray array of shape (n_samples, n_features_new)
-
Transformado array.
get_params(deep=True)
[source]-
Obtenga parámetros para este estimador.
- Parámetros
-
deepbool, default=True
-
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devoluciones
-
paramsdict
-
Nombres de parámetros asignados a sus valores.
get_support(indices=False)
[source]-
Obtenga una máscara, o índice entero, de las características seleccionadas
- Parámetros
-
indicesbool, default=False
-
Si es True, el valor de retorno será un array de enteros, en lugar de una máscara booleana.
- Devoluciones
-
supportarray
-
Un índice que selecciona las características retenidas de un vector de características. Si
indices
es falso, es un booleano array de forma [# input features], en el que un elemento es Verdadero si su característica correspondiente está seleccionada para su retención. Siindices
es cierto, esto es un número entero array de forma [# output features] cuyos valores son índices en el vector de características de entrada.
inverse_transform(X)
[source]-
Invertir la operación de transformación
- Parámetros
-
Xarray of shape [n_samples, n_selected_features]
-
Las muestras de entrada.
- Devoluciones
-
X_rarray of shape [n_samples, n_original_features]
-
X
con columnas de ceros insertadas donde las características habrían sido eliminadas portransform
.
set_params(**params)
[source]-
Establezca los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma
para que sea posible actualizar cada componente de un objeto anidado.__ - Parámetros
-
**paramsdict
-
Parámetros del estimador.
- Devoluciones
-
selfestimator instance
-
Instancia de estimador.
transform(X)
[source]-
Reducir X a las características seleccionadas.
- Parámetros
-
Xarray of shape [n_samples, n_features]
-
Las muestras de entrada.
- Devoluciones
-
X_rarray of shape [n_samples, n_selected_features]
-
Muestras de entrada con solo las características seleccionadas.
Recuerda dar visibilidad a esta noticia si te fue útil.