DW - Tipos

Hay cuatro tipos de sistemas de almacenamiento de datos.

  • Data Mart
  • Procesamiento analítico en línea (OLAP)
  • Procesamiento transaccional en línea (OLTP)
  • Análisis predictivo (PA)

Data Mart

Un Data Mart se conoce como la forma más simple de un sistema de almacenamiento de datos y normalmente consta de un área funcional única en una organización como ventas, finanzas o marketing, etc.

Data Mart en una organización y es creado y administrado por un solo departamento. Como pertenece a un solo departamento, el departamento generalmente obtiene datos de solo unas pocas o un tipo de fuentes / aplicaciones. Esta fuente podría ser un sistema operativo interno, un almacén de datos o un sistema externo.

Procesamiento analítico en línea

En un sistema OLAP, hay menos número de transacciones en comparación con un sistema transaccional. Las consultas ejecutadas son de naturaleza compleja e implican agregaciones de datos.

¿Qué es una agregación?

Guardamos tablas con datos agregados como anual (1 fila), trimestral (4 filas), mensual (12 filas) más o menos, si alguien tiene que hacer una comparación de año a año, solo se procesará una fila. Sin embargo, en una tabla no agregada comparará todas las filas.

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

Medidas efectivas en un sistema OLAP

El tiempo de respuesta es conocido como una de las medidas más efectivas y clave en un OLAPsistema. Los datos almacenados agregados se mantienen en esquemas multidimensionales como los esquemas en estrella (cuando los datos se organizan en grupos jerárquicos, a menudo llamados dimensiones y en hechos y hechos agregados, se denominan esquemas).

La latencia de un sistema OLAP es de unas pocas horas en comparación con los data marts donde se espera una latencia más cercana a un día.

Procesamiento de transacciones en línea

En un sistema OLTP, hay una gran cantidad de transacciones breves en línea, como INSERT, UPDATE y DELETE.

En un sistema OLTP, una medida eficaz es el tiempo de procesamiento de transacciones cortas y es muy inferior. Controla la integridad de los datos en entornos de acceso múltiple. Para un sistema OLTP, el número de transacciones por segundo mide laeffectiveness. Un sistema de almacenamiento de datos OLTP contiene datos actuales y detallados y se mantiene en los esquemas del modelo de entidad (3NF).

Ejemplo

Sistema de transacciones del día a día en una tienda minorista, donde los registros de los clientes se insertan, actualizan y eliminan a diario. Proporciona un procesamiento de consultas muy rápido. Las bases de datos OLTP contienen datos detallados y actualizados. El esquema utilizado para almacenar la base de datos OLTP es el modelo de entidad.

Diferencias entre OLTP y OLAP

Las siguientes ilustraciones muestran las diferencias clave entre un OLTP y OLAP sistema.

  • Indexes - El sistema OLTP tiene solo unos pocos índices, mientras que en un sistema OLAP hay muchos índices para optimizar el rendimiento.

  • Joins- En un sistema OLTP, se normalizan un gran número de uniones y datos. Sin embargo, en un sistema OLAP hay menos uniones y están desnormalizadas.

  • Aggregation - En un sistema OLTP, los datos no se agregan mientras que en una base de datos OLAP se utilizan más agregaciones.

Análisis predictivo

El análisis predictivo se conoce como encontrar patrones ocultos en los datos almacenados en el sistema DW mediante el uso de diferentes funciones matemáticas para predecir resultados futuros.

El sistema de Análisis Predictivo es diferente de un sistema OLAP en términos de su uso. Se utiliza para centrarse en resultados futuros. Un sistema OALP se enfoca en el procesamiento de datos actuales e históricos para informes analíticos.