SAP HANA: esquema en almacén de datos

Los esquemas son descripciones lógicas de tablas en Data Warehouse. Los esquemas se crean uniendo varias tablas de hechos y dimensiones para cumplir con cierta lógica empresarial.

La base de datos utiliza un modelo relacional para almacenar datos. Sin embargo, Data Warehouse usa esquemas que unen dimensiones y tablas de hechos para cumplir con la lógica empresarial. Hay tres tipos de esquemas que se utilizan en un almacén de datos:

  • Esquema de estrella
  • Esquema de copos de nieve
  • Esquema de galaxia

Esquema de estrella

En Star Schema, cada dimensión se une a una sola tabla de hechos. Cada dimensión está representada por una sola dimensión y no se normaliza más.

La tabla de dimensiones contiene un conjunto de atributos que se utilizan para analizar los datos.

Example - En el ejemplo que se muestra a continuación, tenemos una tabla de hechos FactSales que tiene claves primarias para todas las tablas Dim y mide unidades_vendido y dólares_ vendido para realizar análisis.

Tenemos cuatro tablas de dimensiones: DimTime, DimItem, DimBranch, DimLocation

Cada tabla de dimensiones está conectada a la tabla de hechos, ya que la tabla de hechos tiene una clave principal para cada tabla de dimensiones que se utiliza para unir dos tablas.

Los hechos / medidas en la tabla de hechos se utilizan con fines de análisis junto con los atributos en las tablas de dimensiones.

Esquema de copos de nieve

En el esquema de Snowflakes, algunas de las tablas de dimensiones están aún más normalizadas y las tablas de dim están conectadas a una sola tabla de hechos. La normalización se utiliza para organizar atributos y tablas de la base de datos para minimizar la redundancia de datos.

La normalización implica dividir una tabla en tablas más pequeñas menos redundantes sin perder información y las tablas más pequeñas se unen a la tabla Dimension.

En el ejemplo anterior, las tablas DimItem y DimLocation Dimension se normalizan sin perder información. Esto se denomina esquema de copos de nieve, donde las tablas de dimensiones se normalizan aún más a tablas más pequeñas.

Esquema de galaxia

En Galaxy Schema, hay varias tablas de hechos y tablas de dimensiones. Cada tabla de hechos almacena claves primarias de algunas tablas de dimensiones y medidas / hechos para realizar análisis.

En el ejemplo anterior, hay dos tablas de hechos FactSales, FactShipping y varias tablas de dimensiones unidas a tablas de hechos. Cada tabla de hechos contiene la clave principal para las tablas Dim unidas y las medidas / hechos para realizar análisis.