class sklearn.feature_selection.GenericUnivariateSelect(score_func=, *, mode='percentile', param=1e-05)[source]

Selector de funciones univariante con estrategia configurable.

Leer más en el Guía del usuario.

Parámetros
score_funccallable, default=f_classif

Función que toma dos matrices X e y, y devuelve un par de matrices (puntuaciones, valores p). Para los modos ‘percentil’ o ‘kbest’ puede devolver un solo array puntuaciones.

mode‘percentile’, ‘k_best’, ‘fpr’, ‘fdr’, ‘fwe’, default=’percentile’

Modo de selección de funciones.

paramfloat or int depending on the feature selection mode, default=1e-5

Parámetro del modo correspondiente.

Atributos
scores_array-like of shape (n_features,)

Decenas de funciones.

pvalues_array-like of shape (n_features,)

p-valores de las puntuaciones de características, Ninguno si score_func resultados devueltos solamente.

Ver también

f_classif

Valor F ANOVA entre etiqueta / característica para tareas de clasificación.

mutual_info_classif

Información mutua para un objetivo discreto.

chi2

Estadísticas de chi-cuadrado de características no negativas para tareas de clasificación.

f_regression

Valor F entre etiqueta / característica para tareas de regresión.

mutual_info_regression

Información mutua para un objetivo continuo.

SelectPercentile

Seleccione características según el percentil de las puntuaciones más altas.

SelectKBest

Seleccione características basadas en las k puntuaciones más altas.

SelectFpr

Seleccione características basadas en un false prueba de tasa positiva.

SelectFdr

Seleccione características basadas en un estimado false tasa de descubrimiento.

SelectFwe

Seleccione funciones basadas en la tasa de error familiar.

Ejemplos de

>>>from sklearn.datasets import load_breast_cancer
>>>from sklearn.feature_selection import GenericUnivariateSelect, chi2
>>> X, y = load_breast_cancer(return_X_y=True)>>> X.shape
(569,30)>>> transformer = GenericUnivariateSelect(chi2, mode='k_best', param=20)>>> X_new = transformer.fit_transform(X, y)>>> X_new.shape
(569,20)

Métodos

fit(X, y)

Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.

fit_transform(X[, y])

Ajústelos a los datos y luego transfórmelos.

get_params([deep])

Obtenga parámetros para este estimador.

get_support([indices])

Obtenga una máscara, o índice entero, de las características seleccionadas

inverse_transform(X)

Invertir la operación de transformación

set_params(** parámetros)

Establezca los parámetros de este estimador.

transform(X)

Reducir X a las características seleccionadas.

fit(X, y)[source]

Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.

Parámetros
Xarray-like of shape (n_samples, n_features)

Las muestras de entrada de formación.

yarray-like of shape (n_samples,)

Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devoluciones
selfobject
fit_transform(X, y=None, **fit_params)[source]

Ajústelos a los datos y luego transfórmelos.

Se adapta al transformador X y y con parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like of shape (n_samples, n_features)

Muestras de entrada.

yarray-like of shape (n_samples,) or (n_samples, n_outputs), default=None

Valores objetivo (Ninguno para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devoluciones
X_newndarray array of shape (n_samples, n_features_new)

Transformado array.

get_params(deep=True)[source]

Obtenga parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

get_support(indices=False)[source]

Obtenga una máscara, o índice entero, de las características seleccionadas

Parámetros
indicesbool, default=False

Si es verdadero, el valor de retorno será un array de enteros, en lugar de una máscara booleana.

Devoluciones
supportarray

Un índice que selecciona las características retenidas de un vector de características. Si indices es falso, es un booleano array de forma [# input features], en el que un elemento es Verdadero si su característica correspondiente está seleccionada para su retención. Si indices es cierto, esto es un número entero array de forma [# output features] cuyos valores son índices en el vector de características de entrada.

inverse_transform(X)[source]

Invertir la operación de transformación

Parámetros
Xarray of shape [n_samples, n_selected_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_original_features]

X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params(**params)[source]

Establezca los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma __ para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfestimator instance

Instancia de estimador.

transform(X)[source]

Reducir X a las características seleccionadas.

Parámetros
Xarray of shape [n_samples, n_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_selected_features]

Las muestras de entrada con solo las características seleccionadas.