java - traducir - ¿Hay algún gancho Spark Hook Hook?
traductor en ingles y español para escribir (1)
Estoy trabajando en un proyecto y tengo que rastrear el linaje de la transformación de archivos . supongamos que un archivo llamado SomeTextFile.txt pasa por varias acciones de colmena y en la etapa final produce un resultado magnífico según sea necesario.
Caso: 1 Archivo fue como (si aplico acción de colmena sobre el archivo)
Archivo -> FileAfterAction1 -> FileAfterAction2 ---> FinalResultantFile
en este caso estoy usando colmena que almacena datos relacionados con el proceso intermedio aplicado en File.say en un archivo de texto y desde ese linaje de archivo de texto. El código del motor lee y genera Lineage de ese archivo final.
Ahora que hay una chispa involucrada en la tecnología de pila y el cliente puede aplicar la acción de chispa también sobre el archivo.
Caso: 2 sucede lo mismo con el archivo pero ahora es acción Spark.
Pregunta: ¿Hay alguna manera de tomar información intermedia de lo que sucedió con el archivo entre el inicio y el final de las transformaciones?
Lo que obtuve de web hasta ahora es que la transformación de chispas vomita un gráfico intermedio, pero en mi caso el cliente aplicará la acción Spark en lugar de la transformación Spark. Entra en esto si tienes algo de ancho de banda.
https://issues.apache.org/jira/browse/SPARK-18127
Esta funcionalidad se implementaría en Spark 2.2