Almacén de datos: esquemas

Un esquema se define como una descripción lógica de una base de datos donde las tablas de hechos y dimensiones se unen de manera lógica. El almacén de datos se mantiene en forma de esquema de constelación de estrellas, copos de nieve y hechos.

Esquema de estrella

Un esquema en estrella contiene una tabla de hechos y tablas de dimensiones múltiples. Cada dimensión se representa con una tabla de una sola dimensión y no están normalizadas. La tabla de dimensiones contiene un conjunto de atributos.

Caracteristicas

  • En un esquema en estrella, solo hay una tabla de hechos y varias tablas de dimensiones.
  • En un esquema de estrella, cada dimensión está representada por una tabla de una dimensión.
  • Las tablas de dimensiones no están normalizadas en un esquema de estrella.
  • Cada tabla de dimensiones se une a una clave en una tabla de hechos.

La siguiente ilustración muestra los datos de ventas de una empresa con respecto a las cuatro dimensiones, a saber, Tiempo, Artículo, Sucursal y Ubicación.

Hay una tabla de hechos en el centro. Contiene las claves de cada una de las cuatro dimensiones. La tabla de hechos también contiene los atributos, a saber, dólares vendidos y unidades vendidas.

Note- Cada dimensión tiene solo una tabla de una dimensión y cada tabla contiene un conjunto de atributos. Por ejemplo, la tabla de dimensiones de ubicación contiene el conjunto de atributos {location_key, street, city, province_or_state, country}. Esta restricción puede causar redundancia de datos.

For example- "Vancouver" y "Victoria" ambas ciudades se encuentran en la provincia canadiense de Columbia Británica. Las entradas para tales ciudades pueden causar redundancia de datos a lo largo de los atributos province_or_state y country.

Esquema de copos de nieve

Algunas tablas de dimensiones del esquema Snowflake están normalizadas. La normalización divide los datos en tablas adicionales como se muestra en la siguiente ilustración.

A diferencia del esquema de estrella, la tabla de dimensiones en un esquema de copo de nieve está normalizada.

For example- La tabla de dimensiones de artículo en un esquema en estrella se normaliza y se divide en dos tablas de dimensiones, a saber, tabla de artículo y de proveedor. Ahora, la tabla de dimensiones del artículo contiene los atributos item_key, item_name, type, brand y provider-key.

La clave del proveedor está vinculada a la tabla de dimensiones del proveedor. La tabla de dimensiones del proveedor contiene los atributos clave_proveedor y tipo_proveedor.

Note - Debido a la normalización en el esquema Snowflake, la redundancia se reduce y por lo tanto, se vuelve fácil de mantener y el ahorro de espacio de almacenamiento.

Esquema de constelación de hechos (esquema de galaxia)

Una constelación de hechos tiene varias tablas de hechos. También se conoce como Galaxy Schema.

La siguiente ilustración muestra dos tablas de hechos, a saber, Ventas y Envíos:

La tabla de hechos de ventas es la misma que la del esquema en estrella. La tabla de datos de envío tiene cinco dimensiones, a saber, item_key, time_key, shipper_key, from_location, to_location. La tabla de datos de envío también contiene dos medidas, a saber, dólares vendidos y unidades vendidas. También es posible compartir tablas de dimensiones entre tablas de hechos.

For example - Las tablas de dimensión de tiempo, artículo y ubicación se comparten entre la tabla de hechos de ventas y envío.