Esta es la solución más acertada que te podemos brindar, sin embargo mírala pausadamente y analiza si se adapta a tu trabajo.
Solución:
Puedes usar when
y otherwise
me gusta –
from pyspark.sql.functions import *
df
.withColumn('Id_New',when(df.Rank <= 5,df.Id).otherwise('other'))
.drop(df.Id)
.select(col('Id_New').alias('Id'),col('Rank'))
.show()
esto da salida como -
+-----+----+
| Id|Rank|
+-----+----+
| a| 5|
|other| 7|
|other| 8|
| d| 1|
+-----+----+
Comenzando con la solución @Pushkr, ¿no podría simplemente usar lo siguiente?
from pyspark.sql.functions import *
df.withColumn('Id',when(df.Rank <= 5,df.Id).otherwise('other')).show()
Valoraciones y reseñas
Finalizando este artículo puedes encontrar las acotaciones de otros usuarios, tú además tienes la habilidad mostrar el tuyo si dominas el tema.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)