drop data create column python pyspark spark-dataframe

python - data - pyspark join



Python/pyspark data frame reorganiza las columnas (1)

Puede utilizar select para cambiar el orden de las columnas:

df.select("id","name","time","city")

Tengo un marco de datos en python / pyspark con columnas id time city zip y así sucesivamente ......

Ahora agregué un nuevo name columna a este marco de datos.

Ahora tengo que organizar las columnas de tal manera que la columna del name aparezca después de id

Lo he hecho como abajo

change_cols = [''id'', ''name''] cols = ([col for col in change_cols if col in df] + [col for col in df if col not in change_cols]) df = df[cols]

Estoy recibiendo este error

pyspark.sql.utils.AnalysisException: u"Reference ''id'' is ambiguous, could be: id#609, id#1224.;"

¿Por qué está ocurriendo este error? ¿Cómo puedo rectificar esto?