▷Convierta un DataFrame Spark a pandas DF ✔️ Foro Ayuda 【 2024 】

Solución:

lo siguiente debería funcionar

some_df = sc.parallelize([
 ("A", "no"),
 ("B", "yes"),
 ("B", "yes"),
 ("B", "no")]
 ).toDF(["user_id", "phone_number"])
pandas_df = some_df.toPandas()

En mi caso, la siguiente conversión de Spark dataframe a pandas dataframe funcionó:

pandas_df = spark_df.select("*").toPandas()

Convertir el marco de datos de Spark a pandas puede llevar tiempo si tiene un marco de datos grande. Entonces puedes usar algo como a continuación:

spark.conf.set("spark.sql.execution.arrow.enabled", "true")

pd_df = df_spark.toPandas()

He intentado esto en DataBricks.

¡Haz clic para puntuar esta entrada!

(Votos: 0 Promedio: 0)

Utiliza Nuestro Buscador

Preguntas Relacionadas:

Convierta la lista de diccionarios en un DataFrame de pandas
Funciones de ventana similares a SQL en PANDAS: Numeración…
Diferencia entre DataFrame, Dataset y RDD en Spark
Filtro Spark DataFrame en cadena contiene
Seleccionar columnas específicas de Spark DataFrame
Spark DataFrame: seleccione n filas aleatorias
Iterar filas y columnas en el dataframe de Spark
Transponer DataFrame sin agregación en Spark con scala
¿Cómo encontrar el tamaño de Spark RDD/Dataframe?
Spark dataframe transforma varias filas en columnas
Cambiar el nombre de las columnas de un DataFrame en Spark…
Caso de Spark Dataframe anidado cuando declaración