Si hallas algún error con tu código o trabajo, recuerda probar siempre en un entorno de testing antes añadir el código al proyecto final.
Solución:
Puedes usar trunc
:
import pyspark.sql.functions as f
df.withColumn("first_date", f.trunc("date", "month")).show()
+----------+----------+
| date|first_date|
+----------+----------+
|2017-11-25|2017-11-01|
|2017-12-21|2017-12-01|
|2017-09-12|2017-09-01|
+----------+----------+
Recuerda algo, que puedes optar por la opción de glosar si diste con la respuesta.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)