failover high-availability disaster-recovery

Failover y recuperación de desastres



high-availability disaster-recovery (3)

Conmutación por falla: cuando una máquina falla, otra máquina (generalmente en la misma ubicación) toma el control y reanuda el servicio

Recuperación ante desastres: cuando Godzilla destruye su centro de datos, tiene ubicaciones alternativas para seguir brindando su servicio y protocolos / medios para que la otra ubicación sepa cómo seguir entregando el servicio.

Dependiendo de las necesidades particulares de cada servicio, la recuperación de desastres podría ser solo una cinta de seguridad en una ubicación diferente. En otras palabras, es solo tener un protocolo definido para recuperarse de un desastre. Del mismo modo, la conmutación por error podría ser tener una máquina de copia de seguridad de repuesto que lo haga ir al centro de datos para que tome el lugar del que falló, es decir, que tenga un protocolo definido sobre qué hacer en caso de falla de la máquina.

En resumen, la conmutación por error responde a la pregunta "¿qué debo hacer si falla una sola máquina?", Responde la recuperación ante desastres "¿qué hago en caso de que ocurra un desastre (incendio, inundaciones, guerra, ISP quiebra, lo que sea)?

Arquitectura de implementación de alta disponibilidad

¿Cuál es la diferencia entre failover y recuperación de desastres?


Dado que un desastre (como el 9/11) puede destruir completamente un centro de datos, ¿significa que DR es el proceso de reconstrucción de todo para ese centro de datos?


La conmutación por error está más vinculada al procedimiento de copia de seguridad .

La principal diferencia entre los dos, desde el punto de vista del cliente final es el tiempo de inactividad .

  • Se espera que el failover tenga un tiempo de inactividad bajo (1 2 horas superior)
  • DR puede tener cualquier cosa entre 6 horas a un día o dos.

La otra diferencia es la naturaleza de los entornos disponibles después de un failover o un DR.

  • Failover significa que los clientes finales no ven nada y pueden continuar su actividad (desarrollo o gestión de producción)
  • DR debe significar que solo el entorno de producción está respaldado. Todos los entornos de desarrollo están caídos o gravemente degradados.