Te doy la bienvenida a nuestra página, en este lugar vas a hallar la respuesta a lo que andabas buscando.
Ejemplo 1: eliminar los valores atípicos de los pandas de Python
#------------------------------------------------------------------------------# accept a dataframe, remove outliers, return cleaned data in a new dataframe# see http://www.itl.nist.gov/div898/handbook/prc/section1/prc16.htm#------------------------------------------------------------------------------defremove_outlier(df_in, col_name):
q1 = df_in[col_name].quantile(0.25)
q3 = df_in[col_name].quantile(0.75)
iqr = q3-q1 #Interquartile range
fence_low = q1-1.5*iqr
fence_high = q3+1.5*iqr
df_out = df_in.loc[(df_in[col_name]> fence_low)&(df_in[col_name]< fence_high)]return df_out
Ejemplo 2: eliminar valores atípicos en pandas
cols =['col_1','col_2']# one or more
Q1 = df[cols].quantile(0.25)
Q3 = df[cols].quantile(0.75)
IQR = Q3 - Q1
df = df[~((df[cols]<(Q1 -1.5* IQR))|(df[cols]>(Q3 +1.5* IQR))).any(axis=1)]
Ejemplo 3: eliminar los valores atípicos de los pandas de Python
df = pd.DataFrame(np.random.randn(100,3))from scipy import stats
df[(np.abs(stats.zscore(df))<3).all(axis=1)]
Ejemplo 4: eliminación de valores atípicos
#Removing outliers first then skewnessfrom scipy.stats import zscore
z=abs(zscore(df))print(z.shape)
df=df[(z<3).all(axis=1)]
df.shape
Ejemplo 5: eliminar valores atípicos en pandas
Q1 = df.quantile(0.25)
Q3 = df.quantile(0.75)
IQR = Q3 - Q1
df = df[~((df <(Q1 -1.5* IQR))|(df >(Q3 +1.5* IQR))).any(axis=1)]
Acuérdate de que puedes añadir un enjuiciamiento acertado si diste con el resultado.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)