warehouse tipos example ejemplos data cubos cubo componentes data-warehouse olap olap-cube

data-warehouse - tipos - olap cube writer



Data Warehouse vs. OLAP Cube? (3)

¿Alguien puede explicar qué es realmente la distinción entre Data Warehouse y OLAP Cubes?

¿Son diferentes enfoques para lo mismo?

¿Uno de ellos está en desuso en comparación con otro?

¿Hay algún problema de rendimiento en uno de ellos?

Cualquier explicación es bienvenida


¿Son diferentes enfoques para lo mismo?

No, un almacén de datos es un lugar para almacenar datos en un formato fácilmente analizable, y OLAP es un método para analizar datos.

¡No, realmente hacen las mismas cosas! OLAP es más precalculado que DWH. OLAP es como agregados en DWH


Un almacén de datos contiene los datos sobre los que desea ejecutar informes, analizar, etc.

Un cubo organiza estos datos agrupando los datos en dimensiones definidas. Puede tener múltiples dimensiones (piense en una tabla de uber-pivote en Excel).

Por ejemplo, en su almacén de datos tiene todas sus ventas, pero ejecutar consultas complejas de SQL puede llevar mucho tiempo. Entonces, desde su almacén de datos, crea un cubo que indexa y calcula los datos. En su cubo puede tener todas esas dimensiones precalculadas: ventas por meses, por semana, por vendedor, por cliente, por región geográfica, por color de producto, etc. Luego, puede ejecutar consultas OLAP en su cubo para obtener el total, promedio y ventas máximas por (mes, vendedor, región), o por (color, región) o por (vendedor, mes). Dado que todos los datos están precomputados e indexados, las consultas son realmente rápidas.


Un almacén de datos es una base de datos con un diseño que facilita el análisis de datos † (a menudo con datos de múltiples fuentes). Generalmente se compone de tablas de hechos y tablas de dimensiones y, a menudo, tablas agregadas.

OLAP es un conjunto de operaciones que se pueden hacer en un conjunto de datos, como pivotar, rebanar, cortar en dados, perforar. Por ejemplo, uno puede hacer operaciones OLAP con Excel PivotTables.

Puede tener un almacén de datos y no usar OLAP (solo ejecuta informes).

También puede realizar operaciones OLAP en otra cosa que no sea un almacén de datos, como un archivo plano.

Un servidor OLAP es un tipo de software de servidor que facilita las operaciones OLAP, por ejemplo, con el almacenamiento en caché y la reescritura de consultas. Las operaciones OLAP a menudo se expresan en MDX , y su servidor OLAP puede traducir MDX a SQL regular para su base de datos. O podría funcionar contra su propio formato de archivo binario.

¿Son diferentes enfoques para lo mismo?

No, un almacén de datos es un lugar para almacenar datos en un formato fácilmente analizable, y OLAP es un método para analizar datos.

¿Uno de ellos está en desuso en comparación con otro?

No, se complementan entre sí porque un almacén de datos facilita el análisis de datos mediante OLAP, y OLAP puede hacer que el análisis de un almacén de datos sea más útil.

¿Hay algún problema de rendimiento en uno de ellos?

Sí. Un almacén de datos está destinado a almacenar una gran cantidad de datos y, por lo tanto, llevará tiempo realizar consultas. El rendimiento puede mejorarse mediante el uso de índices, almacenamiento en caché, partición y preagregación de algunos datos.

Consulte también: https://dba.stackexchange.com/questions/45655/what-are-measures-and-dimensions-in-cubes

† en lugar de hacer las transacciones más fáciles / más integrales