Tutorial de Apache Pig

Apache Pig es una abstracción de MapReduce. Es una herramienta / plataforma que se utiliza para analizar conjuntos de datos más grandes representándolos como flujos de datos. El cerdo se usa generalmente conHadoop; podemos realizar todas las operaciones de manipulación de datos en Hadoop usando Pig.

Este tutorial está destinado a todos aquellos profesionales que trabajan en Hadoop y que deseen realizar operaciones de MapReduce sin tener que escribir códigos complejos en Java.

Para aprovechar al máximo este tutorial, debe tener una buena comprensión de los conceptos básicos de los comandos de Hadoop y HDFS. Sin duda le ayudará si es bueno en SQL.