Apache Presto - Herramientas de administración

En este capítulo, discutiremos las herramientas de administración utilizadas en Presto. Comencemos con la Interfaz Web de Presto.

Interfaz web

Presto proporciona una interfaz web para monitorear y administrar consultas. Se puede acceder desde el número de puerto especificado en las Propiedades de configuración del coordinador.

Inicie el servidor Presto y la CLI de Presto. Luego puede acceder a la interfaz web desde la siguiente URL:http://localhost:8080/

La salida será similar a la pantalla anterior.

Aquí, la página principal tiene una lista de consultas junto con información como ID de consulta única, texto de consulta, estado de consulta, porcentaje completado, nombre de usuario y fuente desde la que se origina esta consulta. Las consultas más recientes se ejecutan primero, luego las consultas completadas o no completadas se muestran en la parte inferior.

Afinando la interpretación en Presto

Si el clúster de Presto tiene problemas relacionados con el rendimiento, cambie los valores de configuración predeterminados a los siguientes valores.

Propiedades de configuración

  • task. info -refresh-max-wait - Reduce la carga de trabajo del coordinador.

  • task.max-worker-threads - Divide el proceso y lo asigna a cada nodo trabajador.

  • distributed-joins-enabled - Uniones distribuidas basadas en hash.

  • node-scheduler.network-topology - Establece la topología de la red en el planificador.

Configuración de JVM

Cambie la configuración predeterminada de JVM a la siguiente configuración. Esto será útil para diagnosticar problemas de recolección de basura.

-XX:+PrintGCApplicationConcurrentTime 
-XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCCause 
-XX:+PrintGCDateStamps 
-XX:+PrintGCTimeStamps 
-XX:+PrintGCDetails 
-XX:+PrintReferenceGC 
-XX:+PrintClassHistogramAfterFullGC 
-XX:+PrintClassHistogramBeforeFullGC 
-XX:PrintFLSStatistics = 2 
-XX:+PrintAdaptiveSizePolicy 
-XX:+PrintSafepointStatistics 
-XX:PrintSafepointStatisticsCount = 1