Nagios - Cheques y estados

Una vez que el host y los servicios están configurados en Nagios, se utilizan comprobaciones para ver si los hosts y los servicios funcionan como se supone que deben hacerlo o no. Veamos un ejemplo para realizar comprobaciones en el host:

Considere que ha puesto sus definiciones de host dentro del archivo host1.cfg en el directorio / usr / local / nagios / etc / objects.

cd /usr/local/nagios/etc/objects
gedit host1.cfg

Así es como se ven sus definiciones de host actualmente:

define host {
   host_name host1
   address 10.0.0.1
}

Ahora agreguemos la directiva check_interval. Esta directiva se utiliza para realizar comprobaciones programadas de los hosts para el número que estableció; por defecto es en minutos. Utilizando la definición siguiente, se realizarán comprobaciones en el host cada 3 minutos.

define host {
   host_name host1
   address 10.0.0.1
   check_interval 3
}

En Nagios, se realizan 2 tipos de comprobaciones en hosts y servicios:

  • Cheques activos
  • Cheques pasivos

Cheques activos

Las comprobaciones activas son iniciadas por el proceso de Nagios y luego se ejecutan de forma regular programada. La lógica de verificación dentro del proceso de Nagios inicia la verificación activa. Para monitorear hosts y servicios que se ejecutan en máquinas remotas, Nagios ejecuta complementos e indica qué información recopilar. Luego, el complemento se ejecuta en la máquina remota donde recopila la información requerida y la envía de regreso al demonio de Nagios. Según el estado recibido en los hosts y los servicios, se toman las medidas adecuadas.

La figura que se muestra a continuación muestra una verificación activa:

Estos se ejecutan en intervalos regulares, según lo definido por check_interval y retry_interval.

Los procesos externos realizan comprobaciones pasivas y los resultados se devuelven a Nagios para su procesamiento.

Los controles pasivos funcionan como se explica aquí:

Una aplicación externa verifica el estado de los hosts / servicios y escribe el resultado en el archivo de comando externo. Cuando el demonio de Nagios lee un archivo de comando externo, lee y envía todas las comprobaciones pasivas en la cola para procesarlas más tarde. Periódicamente, cuando se procesan estos cheques, se envían notificaciones o alertas según la información del resultado del cheque.

La figura que se muestra a continuación muestra una verificación pasiva:

Por lo tanto, la diferencia entre verificación activa y pasiva es que las verificaciones activas son ejecutadas por Nagios y las verificaciones pasivas son ejecutadas por aplicaciones externas.

Estas comprobaciones son útiles cuando no puede supervisar hosts / servicios de forma regular.

Nagios almacena el estado de los hosts y servicios que está monitoreando para determinar si están funcionando correctamente o no. Habría muchos casos en los que las fallas ocurrirán al azar y serán temporales; por lo tanto, Nagios usa estados para verificar el estado actual de un host o servicio.

Hay dos tipos de estados:

  • Estado suave
  • Estado duro

Estado suave

Cuando un host o servicio está inactivo durante un período de tiempo muy corto y su estado no se conoce o es diferente del anterior, se utilizan los estados suaves. El host o los servicios se probarán una y otra vez hasta que el estado sea permanente.

Estado duro

Cuando se ejecuta max_check_attempts y el estado del host o servicio aún no es correcto, se usa el estado duro. Nagios ejecuta controladores de eventos para manejar estados duros.

La siguiente figura muestra estados blandos y estados duros.