Carolina, miembro de nuestro equipo, nos ha hecho el favor de crear esta reseña porque domina a la perfección el tema.
Ejemplo 1: los pandas dividen el marco de datos para entrenar y probar
train=df.sample(frac=0.8,random_state=200)#random state is a seed value
test=df.drop(train.index)
Ejemplo 2: prueba de tren dividido de pandas
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.2)
Ejemplo 3: tren de datos dividido, prueba por id python
train_inds, test_inds =next(GroupShuffleSplit(test_size=.20, n_splits=2, random_state =7).split(df, groups=df['Group_Id']))
train = df.iloc[train_inds]
test = df.iloc[test_inds]
Ejemplo 4: código para prueba y división de trenes
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size =0.33, random_state =42)
Ejemplo 5: código dividido de prueba de tren en pandas
df_permutated = df.sample(frac=1)
train_size =0.8
train_end =int(len(df_permutated)*train_size)
df_train = df_permutated[:train_end]
df_test = df_permutated[train_end:]
Ejemplo 6: división de datos en entrenamiento y prueba sklearn
train_features, test_features, train_labels, test_labels =
train_test_split(features, labels)#This is using sklearn
Recuerda que puedes difundir esta crónica si si solucionó tu problema.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)