structtype spark examples crear python apache-spark dataframe pyspark

python - examples - Viendo el contenido de una columna de Spark Dataframe



python spark dataframe (2)

Estoy usando Spark 1.3.1.

Estoy tratando de ver los valores de una columna de marco de datos Spark en Python. Con un marco de datos de Spark, puedo hacer df.collect() para ver el contenido del marco de datos, pero no hay tal método para una columna de marcos de datos de Spark como mejor puedo ver.

Por ejemplo, el df marco de datos contiene una columna llamada ''zip_code'' . Entonces puedo hacer df[''zip_code''] y se convierte en un tipo pyspark.sql.dataframe.Column , pero no puedo encontrar una manera de ver los valores en df[''zip_code''] .


Para ver el contenido completo:

df.select("raw").take(1).foreach(println)

(El show te mostrará un resumen).


Puedes acceder al RDD subyacente y RDD

df.rdd.map(lambda r: r.zip_code).collect()

También puede usar select si no le importa que los resultados se ajusten utilizando objetos de Row :

df.select(''zip_code'').collect()

Finalmente, si simplemente desea inspeccionar el contenido, entonces el método de show debería ser suficiente:

df.select(''zip_code'').show()