tutorial replicacion espaƱol datos cassandra backup restore

replicacion - cassandra base de datos



Restaure los datos del cluster de cassandra cuando accidentalmente coloque la tabla (2)

Como sabe, el clúster Cassandra tiene replicación para evitar la pérdida de datos, incluso si hay algún nodo en el clúster inactivo. Pero en el caso de que un administrador soltara accidentalmente una tabla con gran cantidad de datos, y ese comando ya había sido ejecutado por todas las réplicas del clúster, ¿significa que perdió esa tabla y no puede restaurarla? ¿Hay alguna sugerencia para hacer frente a este tipo de desastres con el tiempo de inactividad del servidor corto?


De los documentos de Casandra:

auto_snapshot (Valor predeterminado: true) Habilita o deshabilita si se toma una instantánea de los datos antes del truncamiento del espacio de claves o de las tablas. Para evitar la pérdida de datos, se recomienda encarecidamente utilizar la configuración predeterminada. Si configura a falso, perderá datos en truncamiento o caída.


Si el administrador ha sido eliminado de los datos y replicado en todos los nodos, es difícil recuperar los datos sin una copia de seguridad consistente.

Tal vez teniendo en cuenta que las eliminaciones en Casandra no se ejecutan al instante, puede recuperar los datos. Cuando elimina datos, cassandra reemplaza los datos con una lápida sepulcral. La lápida sepulcral se puede propagar a las réplicas que se perdieron la solicitud de eliminación inicial.

Ver http://wiki.apache.org/cassandra/DistributedDeletes

Las columnas marcadas con una lápida sepulcral existen para un período de tiempo configurado (definido por el valor de gc_grace_seconds establecido en la familia de columnas), y luego son borradas permanentemente por el proceso de compactación después de que ese tiempo haya expirado. El valor predeterminado es 10 días.

Siguiendo la explicación en Acerca de eliminaciones, tal vez si apaga algunos de los nodos y espera hasta que la compactación tenga éxito y los datos se eliminen por completo de los archivos SSTables y luego vuelva a encender los nodos, los datos podrían volver a aparecer. Pero esto solo ocurrirá si no realiza operaciones de reparación periódicas en el nodo.

Nunca lo he intentado antes, solo es una idea que me viene a la cabeza leer la documentación de la casandra.