Apache NiFi - Procesadores

Los procesadores Apache NiFi son los bloques básicos para crear un flujo de datos. Cada procesador tiene una funcionalidad diferente, lo que contribuye a la creación de un archivo de flujo de salida. El flujo de datos que se muestra en la imagen a continuación está obteniendo el archivo de un directorio usando el procesador GetFile y almacenándolo en otro directorio usando el procesador PutFile.

Obtener el archivo

El proceso GetFile se utiliza para recuperar archivos de un formato específico de un directorio específico. También proporciona otras opciones al usuario para un mayor control sobre la búsqueda. Lo discutiremos en la sección de propiedades a continuación.

Configuración de GetFile

A continuación se muestran las diferentes configuraciones del procesador GetFile:

Nombre

En la configuración de Nombre, un usuario puede definir cualquier nombre para los procesadores, ya sea de acuerdo con el proyecto o por eso, lo que hace que el nombre sea más significativo.

Habilitar

Un usuario puede habilitar o deshabilitar el procesador usando esta configuración.

Duración de la penalización

Esta configuración permite al usuario agregar la duración del tiempo de penalización, en caso de falla del archivo de flujo.

Duración del rendimiento

Esta configuración se utiliza para especificar el tiempo de rendimiento del procesador. En esta duración, el proceso no se vuelve a programar.

Nivel de boletín

Esta configuración se utiliza para especificar el nivel de registro de ese procesador.

Terminar relaciones automáticamente

Esto tiene una lista de verificación de toda la relación disponible de ese proceso en particular. Al marcar las casillas, un usuario puede programar el procesador para terminar el archivo de flujo en ese evento y no enviarlo más en el flujo.

Programación de GetFile

Estas son las siguientes opciones de programación que ofrece el procesador GetFile:

Estrategia de programación

Puede programar el proceso en función del tiempo seleccionando impulsado por tiempo o una cadena CRON especificada seleccionando una opción de controlador CRON.

Tareas concurrentes

Esta opción se utiliza para definir la programación de tareas simultáneas para este procesador.

Ejecución

Un usuario puede definir si ejecutará el procesador en todos los nodos o solo en el nodo principal mediante esta opción.

Ejecutar programa

Se utiliza para definir el tiempo para la estrategia impulsada por el tiempo o la expresión CRON para la estrategia impulsada por CRON.

Propiedades de GetFile

GetFile ofrece múltiples propiedades como se muestra en la imagen a continuación, que muestra propiedades obligatorias como el directorio de entrada y el filtro de archivos a propiedades opcionales como el filtro de ruta y el tamaño máximo de archivo. Un usuario puede administrar el proceso de obtención de archivos utilizando estas propiedades.

Comentarios de GetFile

Esta sección se utiliza para especificar cualquier información sobre el procesador.

PutFile

El procesador PutFile se utiliza para almacenar el archivo del flujo de datos a una ubicación específica.

Configuración de PutFile

El procesador PutFile tiene las siguientes configuraciones:

Nombre

En la configuración de Nombre, un usuario puede definir cualquier nombre para los procesadores de acuerdo con el proyecto o por lo que hace que el nombre sea más significativo.

Habilitar

Un usuario puede habilitar o deshabilitar el procesador usando esta configuración.

Duración de la penalización

Esta configuración permite al usuario agregar la duración del tiempo de penalización, en caso de falla del archivo de flujo.

Duración del rendimiento

Esta configuración se utiliza para especificar el tiempo de rendimiento del procesador. En esta duración, el proceso no se vuelve a programar.

Nivel de boletín

Esta configuración se utiliza para especificar el nivel de registro de ese procesador.

Terminar relaciones automáticamente

Esta configuración tiene una lista de verificación de toda la relación disponible de ese proceso en particular. Al marcar las casillas, el usuario puede programar el procesador para terminar el archivo de flujo en ese evento y no enviarlo más en el flujo.

Programación PutFile

Estas son las siguientes opciones de programación que ofrece el procesador PutFile:

Estrategia de programación

Puede programar el proceso en función del tiempo seleccionando el temporizador o una cadena CRON específica seleccionando la opción de controlador CRON. También hay una estrategia experimental basada en eventos, que activará el procesador en un evento específico.

Tareas concurrentes

Esta opción se utiliza para definir la programación de tareas simultáneas para este procesador.

Ejecución

Un usuario puede definir si ejecutar el procesador en todos los nodos o solo en el nodo primario mediante esta opción.

Ejecutar programa

Se utiliza para definir el tiempo para la estrategia impulsada por temporizador o la expresión CRON para la estrategia impulsada por CRON.

Propiedades de PutFile

El procesador PutFile proporciona propiedades como Directorio para especificar el directorio de salida con el fin de transferir archivos y otras para administrar la transferencia, como se muestra en la imagen a continuación.

Comentarios de PutFile

Esta sección se utiliza para especificar cualquier información sobre el procesador.