sqlcontext spark saveastable read python apache-spark pyspark spark-dataframe

python - saveastable - Spark DataFrame groupBy y ordena en orden descendente(pyspark)



sqlcontext spark python (2)

En el método de sort PySpark 1.3 no se toma el parámetro ascendente. Puedes usar el método desc lugar:

from pyspark.sql.functions import col (group_by_dataframe .count() .filter("`count` >= 10") .sort(col("count").desc()))

o función de desc :

from pyspark.sql.functions import desc (group_by_dataframe .count() .filter("`count` >= 10") .sort(desc("count"))

Ambos métodos se pueden usar con Spark> = 1.3 (incluido Spark 2.x).

Estoy usando pyspark (Python 2.7.9 / Spark 1.3.1) y tengo un DataOrame GroupObject que necesito filtrar y ordenar en orden descendente. Tratando de lograrlo a través de este pedazo de código.

group_by_dataframe.count().filter("`count` >= 10").sort(''count'', ascending=False)

Pero arroja el siguiente error.

sort() got an unexpected keyword argument ''ascending''