tutorial que puertos para necesito multinodo instalar descargar como cluster hadoop cluster-computing hive

que - En un clúster hadoop, ¿debería instalarse colmena en todos los nodos?



puertos hadoop (3)

No, no es algo que instales en los nodos de trabajadores. Hive es un cliente de Hadoop. Simplemente ejecuta Hive de acuerdo con las instrucciones que ves en el sitio de Hive .

Soy un novato en Hadoop / Hive y acabo de comenzar a leer los documentos. Hay muchos blogs sobre la instalación de Hadoop en modo de clúster. Además, sé que Hive corre sobre Hadoop. Mi pregunta es: Hadoop está instalado en todos los nodos del clúster. ¿Debo también instalar Hive en todos los nodos del clúster o solo en el nodo maestro?



Hive se usa básicamente para procesar datos estructurados y semiestructurados en Hadoop. También podemos realizar análisis de grandes conjuntos de datos que están presentes en HDFS y también en el sistema de archivos Amazon S3 utilizando Hive. Para consultar la sección de datos también se proporciona un lenguaje de consulta conocido como HiveQL que es similar a SQL. Usando Hive uno puede ejecutar fácilmente consultas Ad-hoc para el análisis de datos. Con Hive no es necesario escribir trabajos complejos de Map-Reduce, solo debemos enviar consultas SQL. Hive convierte estas consultas SQL en trabajos de MapReduce.

Finalmente, Hive SQL se convertirá en trabajos de MapReduce y no es necesario que enviemos trabajos de MapReduce desde todos los nodos de un clúster de Hadoop, de la misma manera que no es necesario que Hive se instale en todos los nodos del clúster de Hadoop.