Apache Tajo - Instalación

Para instalar Apache Tajo, debe tener el siguiente software en su sistema:

  • Hadoop versión 2.3 o superior
  • Java versión 1.7 o superior
  • Linux o Mac OS

Continuemos ahora con los siguientes pasos para instalar Tajo.

Verificación de la instalación de Java

Con suerte, ya ha instalado la versión 8 de Java en su máquina. Ahora, solo debe continuar verificándolo.

Para verificar, use el siguiente comando:

$ java -version

Si Java se instaló correctamente en su máquina, podría ver la versión actual del Java instalado. Si Java no está instalado, siga estos pasos para instalar Java 8 en su máquina.

Descarga JDK

Descargue la última versión de JDK visitando el siguiente enlace y luego descargue la última versión.

https://www.oracle.com

La última versión es JDK 8u 92 y el archivo es “jdk-8u92-linux-x64.tar.gz”. Descargue el archivo en su máquina. A continuación, extraiga los archivos y muévalos a un directorio específico. Ahora, configure las alternativas de Java. Finalmente, Java está instalado en su máquina.

Verificación de la instalación de Hadoop

Ya has instalado Hadoopen su sistema. Ahora, verifíquelo usando el siguiente comando:

$ hadoop version

Si todo está bien con su configuración, entonces podría ver la versión de Hadoop. Si Hadoop no está instalado, descargue e instale Hadoop visitando el siguiente enlace:https://www.apache.org

Instalación de Apache Tajo

Apache Tajo proporciona dos modos de ejecución: modo local y modo totalmente distribuido. Después de verificar la instalación de Java y Hadoop, proceda con los siguientes pasos para instalar el clúster Tajo en su máquina. Una instancia de Tajo en modo local requiere configuraciones muy sencillas.

Descargue la última versión de Tajo visitando el siguiente enlace: https://www.apache.org/dyn/closer.cgi/tajo

Ahora puedes descargar el archivo “tajo-0.11.3.tar.gz” desde su máquina.

Extraer archivo de alquitrán

Extraiga el archivo tar usando el siguiente comando:

$ cd opt/ 
$ tar tajo-0.11.3.tar.gz 
$ cd tajo-0.11.3

Establecer variable de entorno

Agregue los siguientes cambios a “conf/tajo-env.sh” archivo

$ cd tajo-0.11.3 
$ vi conf/tajo-env.sh
 
# Hadoop home. Required 
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
 
# The java implementation to use.  Required. 
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/

Aquí, debe especificar la ruta de Hadoop y Java para “tajo-env.sh”archivo. Una vez realizados los cambios, guarde el archivo y salga del terminal.

Iniciar Tajo Server

Para iniciar el servidor Tajo, ejecute el siguiente comando:

$ bin/start-tajo.sh

Recibirá una respuesta similar a la siguiente:

Starting single TajoMaster 
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../ 
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
 
Tajo master web UI: http://local:26080 
Tajo Client Service: local:26002

Ahora, escriba el comando "jps" para ver los demonios en ejecución.

$ jps  
1010 TajoWorker 
1140 Jps 
933 TajoMaster

Lanzar Tajo Shell (Tsql)

Para iniciar el cliente shell Tajo, use el siguiente comando:

$ bin/tsql

Recibirá el siguiente resultado:

welcome to
   _____ ___  _____ ___ 
  /_  _/ _  |/_  _/   / 
   / // /_| |_/ // / / 
  /_//_/ /_/___/ \__/  0.11.3
  
Try \? for help.

Salir de Tajo Shell

Ejecute el siguiente comando para salir de Tsql:

default> \q 
bye!

Aquí, el valor predeterminado se refiere al catálogo en Tajo.

Interfaz de usuario web

Escriba la siguiente URL para iniciar la interfaz de usuario web de Tajo: http://localhost:26080/

Ahora verá la siguiente pantalla que es similar a la opción ExecuteQuery.

Stop Tajo

Para detener el servidor Tajo, use el siguiente comando:

$ bin/stop-tajo.sh

Obtendrá la siguiente respuesta:

localhost: stopping worker 
stopping master