Devuelve una muestra aleatoria de elementos de un eje de objeto.
Puedes usar estado_aleatorio para la reproducibilidad.
- Parámetros
-
- norte : int, opcional
-
Número de artículos del eje a devolver. No se puede utilizar con frac. Predeterminado = 1 si frac = Ninguno.
- frac : flotador, opcional
-
Fracción de elementos del eje que se devolverán. No se puede utilizar con norte.
- reemplazar : bool, por defecto Falso
-
Permitir o rechazar el muestreo de la misma fila más de una vez.
- pesos : str o ndarray-like, opcional
-
El valor predeterminado “Ninguno” da como resultado una ponderación de probabilidad igual. Si pasa una Serie, se alineará con el objeto de destino en el índice. Los valores de índice en pesos que no se encuentran en el objeto muestreado se ignorarán y los valores de índice en el objeto muestreado que no están en pesos se asignarán pesos de cero. Si se llama en un DataFrame, aceptará el nombre de una columna cuando axis = 0. A menos que los pesos sean una serie, los pesos deben tener la misma longitud que el eje que se muestrea. Si las ponderaciones no suman 1, se normalizarán para sumar 1. Los valores que falten en la columna de ponderaciones se tratarán como cero. No se permiten valores infinitos.
- estado_aleatorio : En t, array-como, BitGenerator, np.random.RandomState, opcional
-
Si es int, array-like, o BitGenerator (NumPy> = 1.17), semilla para el generador de números aleatorios Si np.random.RandomState, usar como objeto numpy RandomState.
Modificado en la versión 1.1.0: array-like y BitGenerator (para NumPy> = 1.17) ahora se pasan a np.random.RandomState () como semilla
- eje : 0 o ‘índice’, 1 o ‘columnas’, Ninguno, Ninguno predeterminado
-
Eje a muestrear. Acepta el número o el nombre del eje. El valor predeterminado es el eje de estadísticas para el tipo de datos dado (0 para Series y DataFrames).
- Devoluciones
-
- Serie o DataFrame
-
Un nuevo objeto del mismo tipo que el llamador que contiene norte elementos muestreados aleatoriamente del objeto llamador.
Ver también
DataFrameGroupBy.sample
-
Genera muestras aleatorias de cada grupo de un objeto DataFrame.
SeriesGroupBy.sample
-
Genera muestras aleatorias de cada grupo de un objeto Serie.
numpy.random.choice
-
Genera una muestra aleatoria a partir de un número 1-D dado array.
Notas
Si frac > 1, reemplazo debe establecerse en Cierto.
Ejemplos de
>>> df = pd.DataFrame('num_legs':[2,4,8,0],...'num_wings':[2,0,0,0],...'num_specimen_seen':[10,2,1,8],... index=['falcon','dog','spider','fish'])>>> df
num_legs num_wings num_specimen_seen
falcon 2210
dog 402
spider 801
fish 008
Extrae 3 elementos aleatorios del Series
df['num_legs']
: Tenga en cuenta que usamos estado_aleatorio para asegurar la reproducibilidad de los ejemplos.
>>> df['num_legs'].sample(n=3, random_state=1)
fish 0
spider 8
falcon 2
Name: num_legs, dtype: int64
Una muestra aleatoria del 50% del DataFrame
con reemplazo:
>>> df.sample(frac=0.5, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 402
fish 008
Una muestra de la DataFrame
con reemplazo: tenga en cuenta que reemplazar el parámetro tiene que ser Cierto por frac parámetro> 1.
>>> df.sample(frac=2, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 402
fish 008
falcon 2210
falcon 2210
fish 008
dog 402
fish 008
dog 402
Usando una columna DataFrame como pesos. Filas con mayor valor en el num_specimen_seen es más probable que se muestreen las columnas.
>>> df.sample(n=2, weights='num_specimen_seen', random_state=1)
num_legs num_wings num_specimen_seen
falcon 2210
fish 008