DBMS distribuido: bases de datos distribuidas

Este capítulo presenta el concepto de DDBMS. En una base de datos distribuida, hay una serie de bases de datos que pueden estar distribuidas geográficamente por todo el mundo. Un DBMS distribuido gestiona la base de datos distribuida de manera que aparece como una sola base de datos para los usuarios. En la última parte del capítulo, pasamos a estudiar los factores que conducen a las bases de datos distribuidas, sus ventajas y desventajas.

UNA distributed database es una colección de múltiples bases de datos interconectadas, que se distribuyen físicamente en varias ubicaciones que se comunican a través de una red informática.

Caracteristicas

  • Las bases de datos de la colección están lógicamente interrelacionadas entre sí. A menudo representan una única base de datos lógica.

  • Los datos se almacenan físicamente en varios sitios. Los datos de cada sitio pueden ser administrados por un DBMS independiente de los otros sitios.

  • Los procesadores en los sitios están conectados a través de una red. No tienen ninguna configuración de multiprocesador.

  • Una base de datos distribuida no es un sistema de archivos débilmente conectado.

  • Una base de datos distribuida incorpora el procesamiento de transacciones, pero no es sinónimo de un sistema de procesamiento de transacciones.

Sistema de gestión de bases de datos distribuidas

Un sistema de administración de bases de datos distribuidas (DDBMS) es un sistema de software centralizado que administra una base de datos distribuida como si todo estuviera almacenado en una única ubicación.

Caracteristicas

  • Se utiliza para crear, recuperar, actualizar y eliminar bases de datos distribuidas.

  • Sincroniza la base de datos periódicamente y proporciona mecanismos de acceso en virtud de los cuales la distribución se vuelve transparente para los usuarios.

  • Garantiza que los datos modificados en cualquier sitio se actualicen universalmente.

  • Se utiliza en áreas de aplicación donde numerosos usuarios procesan y acceden a grandes volúmenes de datos simultáneamente.

  • Está diseñado para plataformas de bases de datos heterogéneas.

  • Mantiene la confidencialidad y la integridad de los datos de las bases de datos.

Factores que fomentan DDBMS

Los siguientes factores fomentan el cambio a DDBMS:

  • Distributed Nature of Organizational Units- La mayoría de las organizaciones en los tiempos actuales se subdividen en múltiples unidades que se distribuyen físicamente por todo el mundo. Cada unidad requiere su propio conjunto de datos locales. Por lo tanto, la base de datos general de la organización se distribuye.

  • Need for Sharing of Data- Las múltiples unidades organizativas a menudo necesitan comunicarse entre sí y compartir sus datos y recursos. Esto exige bases de datos comunes o bases de datos replicadas que deben usarse de manera sincronizada.

  • Support for Both OLTP and OLAP- El procesamiento de transacciones en línea (OLTP) y el procesamiento analítico en línea (OLAP) funcionan en sistemas diversificados que pueden tener datos comunes. Los sistemas de bases de datos distribuidas ayudan a ambos procesos al proporcionar datos sincronizados.

  • Database Recovery- Una de las técnicas comunes utilizadas en DDBMS es la replicación de datos en diferentes sitios. La replicación de datos ayuda automáticamente en la recuperación de datos si la base de datos de cualquier sitio está dañada. Los usuarios pueden acceder a datos de otros sitios mientras se reconstruye el sitio dañado. Por lo tanto, los fallos de la base de datos pueden pasar casi desapercibidos para los usuarios.

  • Support for Multiple Application Software- La mayoría de las organizaciones utilizan una variedad de software de aplicación, cada uno con su soporte de base de datos específico. DDBMS proporciona una funcionalidad uniforme para usar los mismos datos entre diferentes plataformas.

Ventajas de las bases de datos distribuidas

A continuación se muestran las ventajas de las bases de datos distribuidas sobre las bases de datos centralizadas.

Modular Development- Si el sistema necesita expandirse a nuevas ubicaciones o nuevas unidades, en sistemas de bases de datos centralizados, la acción requiere esfuerzos sustanciales y la interrupción del funcionamiento existente. Sin embargo, en las bases de datos distribuidas, el trabajo simplemente requiere agregar nuevas computadoras y datos locales al nuevo sitio y finalmente conectarlos al sistema distribuido, sin interrumpir las funciones actuales.

More Reliable- En caso de fallas en la base de datos, el sistema total de bases de datos centralizadas se detiene. Sin embargo, en los sistemas distribuidos, cuando un componente falla, el funcionamiento del sistema continúa puede tener un rendimiento reducido. Por lo tanto, DDBMS es más confiable.

Better Response- Si los datos se distribuyen de manera eficiente, las solicitudes de los usuarios se pueden satisfacer desde los propios datos locales, proporcionando así una respuesta más rápida. Por otro lado, en los sistemas centralizados, todas las consultas tienen que pasar por la computadora central para su procesamiento, lo que aumenta el tiempo de respuesta.

Lower Communication Cost- En los sistemas de bases de datos distribuidas, si los datos se encuentran localmente donde se utilizan principalmente, los costos de comunicación para la manipulación de datos se pueden minimizar. Esto no es factible en sistemas centralizados.

Adversidades de las bases de datos distribuidas

A continuación se presentan algunas de las adversidades asociadas con las bases de datos distribuidas.

  • Need for complex and expensive software - DDBMS exige un software complejo y, a menudo, caro para proporcionar transparencia y coordinación de datos en los distintos sitios.

  • Processing overhead - Incluso las operaciones simples pueden requerir una gran cantidad de comunicaciones y cálculos adicionales para proporcionar uniformidad en los datos en los sitios.

  • Data integrity - La necesidad de actualizar los datos en varios sitios plantea problemas de integridad de los datos.

  • Overheads for improper data distribution- La capacidad de respuesta de las consultas depende en gran medida de la distribución adecuada de los datos. La distribución incorrecta de datos a menudo conduce a una respuesta muy lenta a las solicitudes de los usuarios.