scala apache-spark cloudera-cdh cloudera-manager

scala - Spark: cómo ejecutar el archivo spark desde spark shell



apache-spark cloudera-cdh (4)

En la línea de comando, puedes usar

spark-shell -i file.scala

para ejecutar el código que está escrito en file.scala


Estoy usando CDH 5.2. Puedo usar spark-shell para ejecutar los comandos.

  1. ¿Cómo puedo ejecutar el archivo (file.spark) que contiene comandos de chispa?
  2. ¿Hay alguna forma de ejecutar / compilar los programas scala en CDH 5.2 sin sbt?

Gracias por adelantado


Para cargar un archivo externo desde spark-shell simplemente haz

:load PATH_TO_FILE

Esto llamará a todo en su archivo.

No tengo una solución para su pregunta SBT, aunque lo siento :-)


Puede usar sbt o maven para compilar programas spark. Simplemente agregue la chispa como dependencia de Maven

<repository> <id>Spark repository</id> <url>http://www.sparkjava.com/nexus/content/repositories/spark/</url> </repository>

Y luego la dependencia:

<dependency> <groupId>spark</groupId> <artifactId>spark</artifactId> <version>1.2.0</version> </dependency>

En términos de ejecutar un archivo con comandos spark: simplemente puede hacer esto:

echo" import org.apache.spark.sql.* ssc = new SQLContext(sc) ssc.sql("select * from mytable").collect " > spark.input

Ahora ejecute el script de comandos:

cat spark.input | spark-shell


Solo para dar más perspectiva a las respuestas

Spark-shell es una respuesta scala

Puede escribir : help para ver la lista de operaciones posibles dentro del shell scala

scala> :help All commands can be abbreviated, e.g., :he instead of :help. :edit <id>|<line> edit history :help [command] print this summary or command-specific help :history [num] show the history (optional num is commands to show) :h? <string> search the history :imports [name name ...] show import history, identifying sources of names :implicits [-v] show the implicits in scope :javap <path|class> disassemble a file or class name :line <id>|<line> place line(s) at the end of history :load <path> interpret lines in a file :paste [-raw] [path] enter paste mode or paste a file :power enable power user mode :quit exit the interpreter :replay [options] reset the repl and replay all previous commands :require <path> add a jar to the classpath :reset [options] reset the repl to its initial state, forgetting all session entries :save <path> save replayable session to a file :sh <command line> run a shell command (result is implicitly => List[String]) :settings <options> update compiler options, if possible; see reset :silent disable/enable automatic printing of results :type [-v] <expr> display the type of an expression without evaluating it :kind [-v] <expr> display the kind of expression''s type :warnings show the suppressed warnings from the most recent line which had any

: cargar líneas de interpretación en un archivo