python - data - pyspark join
Python/pyspark data frame reorganiza las columnas (1)
Puede utilizar select
para cambiar el orden de las columnas:
df.select("id","name","time","city")
Tengo un marco de datos en python / pyspark con columnas id
time
city
zip
y así sucesivamente ......
Ahora agregué un nuevo name
columna a este marco de datos.
Ahora tengo que organizar las columnas de tal manera que la columna del name
aparezca después de id
Lo he hecho como abajo
change_cols = [''id'', ''name'']
cols = ([col for col in change_cols if col in df]
+ [col for col in df if col not in change_cols])
df = df[cols]
Estoy recibiendo este error
pyspark.sql.utils.AnalysisException: u"Reference ''id'' is ambiguous, could be: id#609, id#1224.;"
¿Por qué está ocurriendo este error? ¿Cómo puedo rectificar esto?