Saltar al contenido

dividir el conjunto de datos para entrenar y probar el ejemplo del código python

Carolina, miembro de nuestro equipo, nos ha hecho el favor de crear esta reseña porque domina a la perfección el tema.

Ejemplo 1: los pandas dividen el marco de datos para entrenar y probar

train=df.sample(frac=0.8,random_state=200)#random state is a seed value
test=df.drop(train.index)

Ejemplo 2: prueba de tren dividido de pandas

from sklearn.model_selection import train_test_split

train, test = train_test_split(df, test_size=0.2)

Ejemplo 3: tren de datos dividido, prueba por id python

train_inds, test_inds =next(GroupShuffleSplit(test_size=.20, n_splits=2, random_state =7).split(df, groups=df['Group_Id']))

train = df.iloc[train_inds]
test = df.iloc[test_inds]

Ejemplo 4: código para prueba y división de trenes

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, 
	test_size =0.33, random_state =42)

Ejemplo 5: código dividido de prueba de tren en pandas

df_permutated = df.sample(frac=1)

train_size =0.8
train_end =int(len(df_permutated)*train_size)

df_train = df_permutated[:train_end]
df_test = df_permutated[train_end:]

Ejemplo 6: división de datos en entrenamiento y prueba sklearn

train_features, test_features, train_labels, test_labels = 
train_test_split(features, labels)#This is using sklearn

Recuerda que puedes difundir esta crónica si si solucionó tu problema.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *