class sklearn.feature_selection.SelectPercentile(score_func=, *, percentile=10)[source]

Seleccione características de acuerdo con un percentil de las puntuaciones más altas.

Leer más en el Guía del usuario.

Parámetros
score_funccallable, default=f_classif

Función que toma dos matrices X e y, y devuelve un par de matrices (puntuaciones, valores p) o una única matriz con puntuaciones. El valor predeterminado es f_classif (ver más abajo “Ver también”). La función predeterminada solo funciona con tareas de clasificación.

Nuevo en la versión 0.18.

percentileint, default=10

Porcentaje de funciones para conservar.

Atributos
scores_array-like of shape (n_features,)

Decenas de funciones.

pvalues_array-like of shape (n_features,)

p-valores de las puntuaciones de características, Ninguno si score_func devolvió sólo puntuaciones.

Ver también

f_classif

Valor F ANOVA entre etiqueta / característica para tareas de clasificación.

mutual_info_classif

Información mutua para un objetivo discreto.

chi2

Estadísticas de chi-cuadrado de características no negativas para tareas de clasificación.

f_regression

Valor F entre etiqueta / característica para tareas de regresión.

mutual_info_regression

Información mutua para un objetivo continuo.

SelectKBest

Seleccione características basadas en las k puntuaciones más altas.

SelectFpr

Seleccione características basadas en una prueba de tasa de falsos positivos.

SelectFdr

Seleccione características basadas en una tasa estimada de falsos descubrimientos.

SelectFwe

Seleccione funciones basadas en la tasa de error familiar.

GenericUnivariateSelect

Selector de funciones univariante con modo configurable.

Notas

Los vínculos entre entidades con puntajes iguales se romperán de una manera no especificada.

Ejemplos de

>>>from sklearn.datasets import load_digits
>>>from sklearn.feature_selection import SelectPercentile, chi2
>>> X, y = load_digits(return_X_y=True)>>> X.shape
(1797,64)>>> X_new = SelectPercentile(chi2, percentile=10).fit_transform(X, y)>>> X_new.shape
(1797,7)

Métodos

fit(X, y)

Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.

fit_transform(X[, y])

Ajústelos a los datos y luego transfórmelos.

get_params([deep])

Obtenga parámetros para este estimador.

get_support([indices])

Obtenga una máscara, o índice entero, de las características seleccionadas

inverse_transform(X)

Invertir la operación de transformación

set_params(** parámetros)

Establezca los parámetros de este estimador.

transform(X)

Reducir X a las características seleccionadas.

fit(X, y)[source]

Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.

Parámetros
Xarray-like of shape (n_samples, n_features)

Las muestras de entrada de formación.

yarray-like of shape (n_samples,)

Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devoluciones
selfobject
fit_transform(X, y=None, **fit_params)[source]

Ajústelos a los datos y luego transfórmelos.

Se adapta al transformador X y y con parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like of shape (n_samples, n_features)

Muestras de entrada.

yarray-like of shape (n_samples,) or (n_samples, n_outputs), default=None

Valores objetivo (Ninguno para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devoluciones
X_newndarray array of shape (n_samples, n_features_new)

Matriz transformada.

get_params(deep=True)[source]

Obtenga parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

get_support(indices=False)[source]

Obtenga una máscara, o índice entero, de las características seleccionadas

Parámetros
indicesbool, default=False

Si es True, el valor de retorno será una matriz de números enteros, en lugar de una máscara booleana.

Devoluciones
supportarray

Un índice que selecciona las características retenidas de un vector de características. Si indices es falso, esta es una matriz booleana de forma [# input features], en el que un elemento es Verdadero si su característica correspondiente está seleccionada para su retención. Si indices es Verdadero, esta es una matriz entera de forma [# output features] cuyos valores son índices en el vector de características de entrada.

inverse_transform(X)[source]

Invertir la operación de transformación

Parámetros
Xarray of shape [n_samples, n_selected_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_original_features]

X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params(**params)[source]

Establezca los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma __ para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfestimator instance

Instancia de estimador.

transform(X)[source]

Reducir X a las características seleccionadas.

Parámetros
Xarray of shape [n_samples, n_features]

Las muestras de entrada.

Devoluciones
X_rarray of shape [n_samples, n_selected_features]

Muestras de entrada con solo las características seleccionadas.

Ejemplos usando sklearn.feature_selection.SelectPercentile

Aglomeración de características versus selección univariante

Aglomeración de características frente a selección univariante

SVM-Anova: SVM con selección de características univariadas

SVM-Anova: SVM con selección de características univariadas