Después de de una larga compilación de datos resolvimos este disgusto que tienen algunos de nuestros usuarios. Te compartimos la respuesta y esperamos serte de gran ayuda.
class sklearn.feature_selection.SelectPercentile(score_func=
[source], *, percentile=10) -
Seleccione características de acuerdo con un percentil de las puntuaciones más altas.
Leer más en el Guía del usuario.
- Parámetros
-
score_funccallable, default=f_classif
-
Función que toma dos matrices X e y, y devuelve un par de matrices (puntuaciones, valores p) o una única matriz con puntuaciones. El valor predeterminado es f_classif (ver más abajo “Ver también”). La función predeterminada solo funciona con tareas de clasificación.
Nuevo en la versión 0.18.
percentileint, default=10
-
Porcentaje de funciones para conservar.
- Atributos
-
scores_array-like of shape (n_features,)
-
Decenas de funciones.
pvalues_array-like of shape (n_features,)
-
p-valores de las puntuaciones de características, Ninguno si
score_func
devolvió sólo puntuaciones.
Ver también
f_classif
-
Valor F ANOVA entre etiqueta / característica para tareas de clasificación.
mutual_info_classif
-
Información mutua para un objetivo discreto.
chi2
-
Estadísticas de chi-cuadrado de características no negativas para tareas de clasificación.
f_regression
-
Valor F entre etiqueta / característica para tareas de regresión.
mutual_info_regression
-
Información mutua para un objetivo continuo.
SelectKBest
-
Seleccione características basadas en las k puntuaciones más altas.
SelectFpr
-
Seleccione características basadas en una prueba de tasa de falsos positivos.
SelectFdr
-
Seleccione características basadas en una tasa estimada de falsos descubrimientos.
SelectFwe
-
Seleccione funciones basadas en la tasa de error familiar.
GenericUnivariateSelect
-
Selector de funciones univariante con modo configurable.
Notas
Los vínculos entre entidades con puntajes iguales se romperán de una manera no especificada.
Ejemplos de
>>>from sklearn.datasets import load_digits >>>from sklearn.feature_selection import SelectPercentile, chi2 >>> X, y = load_digits(return_X_y=True)>>> X.shape (1797,64)>>> X_new = SelectPercentile(chi2, percentile=10).fit_transform(X, y)>>> X_new.shape (1797,7)
Métodos
fit
(X, y)Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.
fit_transform
(X[, y])Ajústelos a los datos y luego transfórmelos.
get_params
([deep])Obtenga parámetros para este estimador.
get_support
([indices])Obtenga una máscara, o índice entero, de las características seleccionadas
inverse_transform
(X)Invertir la operación de transformación
set_params
(** parámetros)Establezca los parámetros de este estimador.
transform
(X)Reducir X a las características seleccionadas.
fit(X, y)
[source]-
Ejecute la función de puntuación en (X, y) y obtenga las características adecuadas.
- Parámetros
-
Xarray-like of shape (n_samples, n_features)
-
Las muestras de entrada de formación.
yarray-like of shape (n_samples,)
-
Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).
- Devoluciones
-
selfobject
fit_transform(X, y=None, **fit_params)
[source]-
Ajústelos a los datos y luego transfórmelos.
Se adapta al transformador
X
yy
con parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
-
Xarray-like of shape (n_samples, n_features)
-
Muestras de entrada.
yarray-like of shape (n_samples,) or (n_samples, n_outputs), default=None
-
Valores objetivo (Ninguno para transformaciones no supervisadas).
**fit_paramsdict
-
Parámetros de ajuste adicionales.
- Devoluciones
-
X_newndarray array of shape (n_samples, n_features_new)
-
Matriz transformada.
get_params(deep=True)
[source]-
Obtenga parámetros para este estimador.
- Parámetros
-
deepbool, default=True
-
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devoluciones
-
paramsdict
-
Nombres de parámetros asignados a sus valores.
get_support(indices=False)
[source]-
Obtenga una máscara, o índice entero, de las características seleccionadas
- Parámetros
-
indicesbool, default=False
-
Si es True, el valor de retorno será una matriz de números enteros, en lugar de una máscara booleana.
- Devoluciones
-
supportarray
-
Un índice que selecciona las características retenidas de un vector de características. Si
indices
es falso, esta es una matriz booleana de forma [# input features], en el que un elemento es Verdadero si su característica correspondiente está seleccionada para su retención. Siindices
es Verdadero, esta es una matriz entera de forma [# output features] cuyos valores son índices en el vector de características de entrada.
inverse_transform(X)
[source]-
Invertir la operación de transformación
- Parámetros
-
Xarray of shape [n_samples, n_selected_features]
-
Las muestras de entrada.
- Devoluciones
-
X_rarray of shape [n_samples, n_original_features]
-
X
con columnas de ceros insertadas donde las características habrían sido eliminadas portransform
.
set_params(**params)
[source]-
Establezca los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma
para que sea posible actualizar cada componente de un objeto anidado.__ - Parámetros
-
**paramsdict
-
Parámetros del estimador.
- Devoluciones
-
selfestimator instance
-
Instancia de estimador.
transform(X)
[source]-
Reducir X a las características seleccionadas.
- Parámetros
-
Xarray of shape [n_samples, n_features]
-
Las muestras de entrada.
- Devoluciones
-
X_rarray of shape [n_samples, n_selected_features]
-
Muestras de entrada con solo las características seleccionadas.
Ejemplos usando sklearn.feature_selection.SelectPercentile
Aglomeración de características frente a selección univariante
SVM-Anova: SVM con selección de características univariadas
valoraciones y reseñas
Finalizando este artículo puedes encontrar las observaciones de otros gestores de proyectos, tú incluso eres capaz insertar el tuyo si lo crees conveniente.