hadoop hbase hive

hadoop - ¿Qué es la colmena, es una base de datos?



hbase hive (1)

Acabo de empezar a explorar Hive. Tiene todas las estructuras similares a un RDBMS como tablas, uniones, particiones ... lo que entiendo es que Hive todavía usa HDFS para almacenamiento y es una abstracción de SQL de HDFS. De esto no estoy seguro de que el clima Hive sea una solución de base de datos como HBase, Cassnadra ... o simplemente es un sistema de consulta sobre HDFS. No creo que sea simplemente un lenguaje de consulta porque es tener tablas, uniones y particiones.


Hive es un paquete / infraestructura de almacenamiento de datos construido sobre Hadoop. Proporciona un dialecto SQL, llamado Hive Query Language (HQL) para consultar datos almacenados en un clúster de Hadoop. HQL es el lenguaje de consulta de Hive. Como todos los dialectos de SQL en uso generalizado, no se ajusta completamente a ninguna revisión particular del estándar ANSI SQL. Es quizás más cercano al dialecto de MySQL, pero con diferencias significativas. Hive no ofrece soporte para inserciones, actualizaciones y eliminaciones de nivel de fila. Hive no admite transacciones. Por lo tanto, no podemos compararla con RDBMS. Hive agrega extensiones para proporcionar un mejor rendimiento en el contexto de Hadoop y para integrarse con extensiones personalizadas e incluso programas externos. Es adecuado para datos de procesamiento por lotes como: procesamiento de registros, minería de textos, indexación de documentos, inteligencia de negocios orientada al cliente, modelado predictivo, pruebas de hipótesis, etc.

Hive no está diseñado para el procesamiento de transacciones en línea y no ofrece consultas en tiempo real.