virginia pricing elastic ec2 ebs east aws amazon-web-services amazon-ec2 backup snapshot amazon-ebs

amazon-web-services - pricing - snapshot aws



Amazon EBS, instantáneas como copias de seguridad incrementales (1)

No creo que encuentres documentación detallada sobre cómo se implementan las instantáneas; no es algo con lo que me haya encontrado Tienen documentación para "Proyectar costos". Sin embargo, creo que si sabes cómo funciona, puedes intuir la factura y sentirte más a gusto con ella.

Tenga en cuenta que estas instantáneas no son "incrementales" en la forma en que podemos haber llegado a entender ese término en el sistema operativo DOS. En DOS, el bit de "archivo" se estableció cuando se modificó un archivo, y una copia de seguridad "incremental" copió solo los archivos que tenían el bit de "archivo" establecido. El proceso de copia de seguridad borrará el atributo de archivo, por lo que una edición futura del archivo provocará una copia de seguridad "incremental" una vez más.

Con las instantáneas, cada bloque del volumen se marca si se modifica. No se hace archivo por archivo. Después de la primera instantánea, solo se realizan copias de seguridad de los bloques que se han marcado como modificados, al igual que las copias de seguridad "incrementales" en DOS. Pero ahí es donde terminan las similitudes, porque con cada bloque que no tiene que copiar , no lo omite, sino que escribe un puntero al lugar donde está la última copia (sin modificar) de los datos.

La primera instantánea que hace de un volumen, los datos se dividen en bloques. Desde Amazon: " Los datos del volumen se dividen en fragmentos antes de ser transferidos a Amazon S3. Si bien el tamaño de los fragmentos podría cambiar a través de futuras optimizaciones, el número [...] se puede calcular dividiendo el tamaño de los datos que ha cambiado. desde la última instantánea en 4MB " .

La siguiente instantánea que realiza consiste en datos solo para aquellos bloques que han cambiado y punteros a los bloques que no han cambiado. Esos indicadores apuntan a bloques de datos en la instantánea anterior.

La siguiente instantánea (n) se realiza al registrar los datos de cada bloque modificado desde la instantánea anterior (n-1), junto con los punteros de los bloques que no han cambiado desde la instantánea anterior (n-1). Estos punteros apuntan a los bloques correspondientes en la instantánea anterior, que puede contener datos u otro puntero a su instantánea anterior. Eventualmente, cada apuntador termina en un bloque de datos reales (eso no ha cambiado desde que se creó esa instantánea).

Ahora digamos que decide eliminar una instantánea (x). La instantánea (x) tiene instantáneas hechas antes (x-1) y luego (x + 1). Amazon reemplaza los punteros en la instantánea (x + 1) con los punteros y los datos de la instantánea (x) (la que se elimina). Como resultado, todos los datos reales en la instantánea (x) se copian a la instantánea (x + 1), a menos que tenga allí su propia copia de los datos más recientes para ese bloque.

Así es cómo funcionan las instantáneas, dónde se almacenan los datos y por qué el tamaño de las instantáneas es manejable. A partir de esto, puede comprender cómo la eliminación de una instantánea destruirá solo su capacidad para recuperar el volumen tal como estaba en el momento en que se creó esa instantánea, sin destruir la capacidad de usar sus otras instantáneas. A diferencia de las copias de seguridad "incrementales" simples y tradicionales que no utilizan punteros, las instantáneas que no se eliminan se actualizan según sea necesario para mantener su utilidad cuando se elimina una de sus instantáneas dependientes. Es por eso que tiene sentido que Amazon cobre más por el almacenamiento inteligente de instantáneas que las copias simples de los volúmenes de EBS. Finalmente, es comprensible que sea difícil predecir cuánto costará el almacenamiento instantáneo, ya que es muy dinámico.

Estoy trabajando en un mecanismo automatizado para respaldar diariamente nuestros volúmenes de EBS.

Conozco muy bien los pasos para crear una nueva instantánea. Aparentemente todo es bastante simple, tienes un volumen de EBS que puedes hacer una instantánea, y puedes restaurar la instantánea en cualquier momento. Multa.

Pero mi preocupación es sobre el tamaño de las instantáneas, sé que estas instantáneas se almacenan con compresión en S3 y se nos cobrará según el tamaño de las instantáneas. Si tenemos grandes cantidades de datos, tendremos un aumento significativo en la factura de cada copia de seguridad que realicemos.

Sin embargo, de acuerdo con las páginas de Amazon, estas instantáneas son incrementales. Eso resolvería mi problema ya que la copia de seguridad diaria solo cargaría los datos que han cambiado desde la última instantánea. Pero esto me lleva a la siguiente pregunta: si la copia de seguridad es incremental y solo estamos cargando los datos modificados, ¿dónde se almacenan los datos originales? (es decir, la primera instantánea que obviamente no se pudo haber hecho de forma incremental ...)

Lamentablemente, no he podido encontrar esta información en todos los documentos de Amazon.

¿Alguien tiene experiencia con las instantáneas y su facturación?

Agradecería cualquier ayuda, ¡gracias!