Apache NiFi - Conceptos básicos

Apache NiFi consta de un servidor web, un controlador de flujo y un procesador, que se ejecuta en Java Virtual Machine. También tiene 3 repositorios Flowfile Repository, Content Repository y Provenance Repository como se muestra en la siguiente figura.

Repositorio de Flowfile

Este repositorio almacena el estado actual y los atributos de cada archivo de flujo que pasa por los flujos de datos de Apache NiFi. La ubicación predeterminada de este repositorio está en el directorio raíz de Apache NiFi. La ubicación de este repositorio se puede cambiar cambiando la propiedad denominada "nifi.flowfile.repository.directory".

Repositorio de contenido

Este repositorio contiene todo el contenido presente en todos los archivos de flujo de NiFi. Su directorio predeterminado también está en el directorio raíz de NiFi y se puede cambiar usando la propiedad "org.apache.nifi.controller.repository.FileSystemRepository". Este directorio utiliza mucho espacio en el disco por lo que es recomendable tener suficiente espacio en el disco de instalación.

Repositorio de procedencia

El repositorio rastrea y almacena todos los eventos de todos los archivos de flujo que fluyen en NiFi. Hay dos repositorios de procedencia:volatile provenance repository (en este repositorio todos los datos de procedencia se pierden después del reinicio) y persistent provenance repository. Su directorio predeterminado también está en el directorio raíz de NiFi y se puede cambiar usando la propiedad "org.apache.nifi.provenance.PersistentProvenanceRepository" y "org.apache.nifi.provenance.VolatileProvenanceRepositor" para los respectivos repositorios.