online - ¿Cuál de los muchos núcleos de Spark/Scala para Jupyter/IPython elegir?
jupyter python 3 (3)
He estado usando spark-kernel (su opción n. ° 4) y estoy bastante satisfecho.
Aquí puede encontrar una buena instalación práctica (CDH 5.5 en CentOS 7) (la he usado yo mismo para instalarla en un nodo único en modo pseudo-distribuido).
Hay muchos kernels de Scala / Spark para IPython / Jupyter:
- IScala
- ISpark
- Jupyter Scala
- Apache Toree ( kernel anterior Spark )
¿Alguien sabe cuál de ellos es más compatible con IPython / Jupyter y más cómodo de usar con:
- Scala
- Chispa (Scala)
No puedo hablar por todos ellos, pero uso Spark Kernel y funciona muy bien para usar tanto Scala como Spark.
Encontré IScala y Jupyter Scala menos estables y menos pulidos. Jupyter Scala siempre imprime cada valor variable después de que ejecuto una celda; No quiero ver esto el 99% del tiempo.
Spark Kernel es mi favorito. Tanto para Spark como para el viejo Scala.
Spark Kernel ha sido aceptado en Apache Incubator y ha trasladado todo el desarrollo a Apache Toree .