Saltar al contenido

dividir el conjunto de datos en entrenar y probar el ejemplo de código python

Hacemos una revisión exhaustiva cada sección en nuestro sitio web con la meta de mostrarte siempre información veraz y actual.

Ejemplo 1: los pandas dividen el marco de datos para entrenar y probar

train=df.sample(frac=0.8,random_state=200)#random state is a seed value
test=df.drop(train.index)

Ejemplo 2: prueba de tren dividido de pandas

from sklearn.model_selection import train_test_split


y = df.pop('output')
X = df

X_train,X_test,y_train,y_test = train_test_split(X.index,y,test_size=0.2)
X.iloc[X_train]# return dataframe train

Ejemplo 3: prueba de tren dividido de pandas

from sklearn.model_selection import train_test_split

train, test = train_test_split(df, test_size=0.2)

Ejemplo 4: tren de datos dividido, prueba por id python

train_inds, test_inds =next(GroupShuffleSplit(test_size=.20, n_splits=2, random_state =7).split(df, groups=df['Group_Id']))

train = df.iloc[train_inds]
test = df.iloc[test_inds]

Si te gustó nuestro trabajo, puedes dejar un tutorial acerca de qué te ha impresionado de este ensayo.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *