class sklearn.feature_selection.VarianceThreshold(threshold=0.0)[source]

Selector de funciones que elimina todas las funciones de baja variación.

Este algoritmo de selección de características solo mira las características (X), no las salidas deseadas (y), y por lo tanto se puede usar para el aprendizaje no supervisado.

Leer más en el Guía del usuario.

Parámetros
thresholdfloat, default=0

Se eliminarán las funciones con una variación del conjunto de entrenamiento inferior a este umbral. El valor predeterminado es mantener todas las características con una variación distinta de cero, es decir, eliminar las características que tienen el mismo valor en todas las muestras.

Atributos
variances_array, shape (n_features,)

Variaciones de características individuales.

Notas

Permite NaN en la entrada. Aumenta ValueError si ninguna característica en X alcanza el umbral de variación.

Ejemplos de

El siguiente conjunto de datos tiene características enteras, dos de las cuales son iguales en cada muestra. Estos se eliminan con la configuración predeterminada para el umbral:

>>> X =[[0,2,0,3],[0,1,4,3],[0,1,1,3]]>>> selector = VarianceThreshold()>>> selector.fit_transform(X)
array([[2,0],[1,4],[1,1]])

Métodos

fit(X[, y])

Aprenda las variaciones empíricas de X.

fit_transform(X[, y])

Ajústelos a los datos y luego transfórmelos.

get_params([deep])

Obtenga parámetros para este estimador.

get_support([indices])

Obtenga una máscara, o índice entero, de las características seleccionadas

inverse_transform(X)

Invertir la operación de transformación

set_params(** parámetros)

Establezca los parámetros de este estimador.

transform(X)

Reducir X a las características seleccionadas.

fit(X, y=None)[source]

Aprenda las variaciones empíricas de X.

Parámetros
Xarray-like, sparse matrix, shape (n_samples, n_features)

Vectores de muestra a partir de los cuales calcular las varianzas.

yany, default=None

Ignorado. Este parámetro existe solo por compatibilidad con sklearn.pipeline.Pipeline.

Devoluciones
uno mismo
fit_transform(X, y=None, **fit_params)[source]

Ajústelos a los datos y luego transfórmelos.

Se adapta al transformador X y y con parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like of shape (n_samples, n_features)

Muestras de entrada.

yarray-like of shape (n_samples,) or (n_samples, n_outputs), default=None

Valores objetivo (Ninguno para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devoluciones
X_newndarray array of shape (n_samples, n_features_new)

Transformado array.

get_params(deep=True)[source]

Obtenga parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

get_support(indices=False)[source]

Obtenga una máscara, o índice entero, de las características seleccionadas

Parámetros
indicesbool, default=False

Si es True, el valor de retorno será un array de enteros, en lugar de una máscara booleana.

Devoluciones
supportarray

Un índice que selecciona las características retenidas de un vector de características. Si indices es falso, es un booleano array de forma [# input features], en el que un elemento es Verdadero si su característica correspondiente está seleccionada para su retención. Si indices es cierto, esto es un número entero array de forma [# output features] cuyos valores son índices en el vector de características de entrada.

inverse_transform(X)[source]

Invertir la operación de transformación

Parámetros
Xarray of shape [n_samples, n_selected_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_original_features]

X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params(**params)[source]

Establezca los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma __ para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfestimator instance

Instancia de estimador.

transform(X)[source]

Reducir X a las características seleccionadas.

Parámetros
Xarray of shape [n_samples, n_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_selected_features]

Muestras de entrada con solo las características seleccionadas.