Saltar al contenido

iterar sobre columnas de marco de datos de pyspark

Solución:

Has intentado algo como ésto:

names = df.schema.names
for name in names:
    print(name + ': ' + df.where(df[name].isNull()).count())

Puede ver cómo esto podría modificarse para poner la información en un diccionario o en algún otro formato más útil.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *