HCatalog es una herramienta de gestión de almacenamiento de tablas para Hadoop que expone los datos tabulares de Hive metastore a otras aplicaciones de Hadoop. Permite a los usuarios con diferentes herramientas de procesamiento de datos (Pig, MapReduce) escribir datos fácilmente en una cuadrícula. HCatalog garantiza que los usuarios no tengan que preocuparse por dónde o en qué formato se almacenan sus datos. Este es un pequeño tutorial que explica solo los conceptos básicos de HCatalog y cómo usarlo.
Este tutorial está dirigido a profesionales que aspiran a hacer una carrera en Big Data Analytics utilizando Hadoop Framework. Los desarrolladores de ETL y los profesionales que se dedican a la analítica en general también pueden utilizar este tutorial con buenos resultados.
Antes de continuar con este tutorial, necesita un conocimiento básico de Core Java, conceptos de bases de datos de SQL, sistema de archivos Hadoop y cualquiera de los tipos de sistemas operativos Linux.