Recabamos por todo internet para así brindarte la respuesta para tu inquietud, si tienes alguna duda déjanos tu inquietud y te respondemos con gusto, porque estamos para ayudarte.
Solución:
Si estuviera haciendo un clasificador de algún tipo, personalmente usaría este orden
- Normalización
- PCA
- Selección de características
Normalización: primero haría la normalización para obtener datos dentro de límites razonables. Si tiene datos (x,y) y el rango de x is from -1000 to +1000
y y is from -1 to +1
Puede ver que cualquier métrica de distancia diría automáticamente que un cambio en y es menos significativo que un cambio en X. Todavía no sabemos que ese sea el caso. Así que queremos normalizar nuestros datos.
PCA: utiliza la descomposición de valores propios de los datos para encontrar un conjunto de bases ortogonales que describa la varianza en los puntos de datos. Si tiene 4 características, PCA puede mostrarle que solo 2 características realmente diferencian los puntos de datos, lo que nos lleva al último paso
Selección de características: una vez que tenga un espacio de coordenadas que describa mejor sus datos, puede seleccionar qué características son las más destacadas. Por lo general, usaría los valores propios más grandes (EV) y sus vectores propios correspondientes de PCA para su representación. Dado que los EV más grandes significan que hay más variación en esa dirección de datos, puede obtener más granularidad al aislar características. Este es un buen método para reducir el número de dimensiones de su problema.
por supuesto, esto podría cambiar de un problema a otro, pero eso es simplemente una guía genérica.
Generalmente hablando, Normalización se necesita antes dePCA. los key el problema es el orden de selección de funciones, y depende del método de selección de funciones.
Una simple selección de características es ver si la varianza o la desviación estándar de la característica es pequeña. Si estos valores son relativamente pequeños, esta característica puede no ayudar al clasificador. Pero si realiza la normalización antes de hacer esto, la desviación estándar y la varianza se reducirán (generalmente menos de 1), lo que dará como resultado diferencias muy pequeñas en std o var entre las diferentes características. Si utiliza la normalización de media cero, la la media de todas las características será igual a 0 y la estándar será igual a 1. En este punto, podría ser malo hacer la normalización antes de la selección de características
La selección de características es flexible y hay muchas maneras de seleccionar características. El orden de selección de características debe elegirse de acuerdo con la situación real