warehouse tipos menciona mart lake español entre diferencia datawarehouse data caracteristicas data-warehouse cubes datamart

data-warehouse - tipos - menciona la diferencia entre un data warehouse y un data mart



Datamart vs. Report Cube, ¿cuáles son las diferencias? (8)

Para mí, una datamart es el lugar donde los datos se vuelcan en un formato relativamente plano e inutilizable.

Cube está tomando esa información y haciéndola bailar.

Los términos se usan en todas partes, y no sé de definiciones nítidas. Estoy bastante seguro de que sé lo que es un mercado de datos. Y he creado cubos de informes con herramientas como Business Objects y Cognos.

También he tenido personas que me dicen que una datamart es más que una colección de cubos.

También he tenido personas que me dicen que un datamart es un cubo de informes, nada más.

¿Cuáles son las distinciones que entiendes?


Cube puede (y posiblemente debería) significar algo bastante específico: artefactos OLAP presentados a través de un servidor OLAP como MS Analysis Services u Oracle (nee Hyperion) Essbase . Sin embargo, también se usa mucho más libremente. Los cubos OLAP de este tipo usan herramientas de consulta con reconocimiento de cubos que usan una API diferente para una base de datos relacional estándar. Normalmente, los servidores OLAP mantienen sus propias estructuras de datos optimizadas (conocidas como MOLAP ), aunque pueden implementarse como front-end a una fuente de datos relacionales (conocida como ROLAP ) o en varios modos híbridos (conocidos como HOLAP ).

Intento ser específico y usar ''cube'' específicamente para referirme a cubos en servidores OLAP como SSAS.

Business Objects funciona mediante la consulta de datos a través de una o más fuentes (que pueden ser bases de datos relacionales, cubos OLAP o archivos planos) y creando una estructura de datos en memoria llamada MicroCube que utiliza para admitir actividades interactivas de división de dados. Analysis Services y MSQuery pueden crear un archivo de cubo (.cub) que puede ser abierto por el software de cliente AS o Excel y cortado y dividido en cubos de manera similar. IIRC Las versiones recientes de Business Objects también pueden abrir archivos .cub.

Para ser pedantes, creo que Business Objects se ubica en un espacio de "informes semiestructurados" en algún lugar entre un sistema OLAP verdadero como ProClarity y una herramienta de informes ad hoc como Report Builder , Oracle Discoverer o Brio . Los viajes de ida y vuelta al panel de consultas lo hacen un tanto torpe como una herramienta OLAP de pura corriente de pensamiento, pero ofrece un nivel de interactividad que los informes tradicionales no ofrecen. Veo el punto positivo de Business Objects como estar sentado en dos lugares: informes ad-hoc por parte del personal no necesariamente familiarizado con SQL y proporcionar un informe programado entregado en un formato interactivo que permite un desglose en los datos.

''Data Mart'' también es un término bastante poco utilizado y puede significar cualquier medio de acceso a datos de usuario para un sistema de depósito de datos. La definición puede incluir o no las herramientas de informes y las capas de metadatos, las tablas de capas de informes u otros elementos como cubos u otros sistemas analíticos.

Tiendo a pensar en un centro de datos como la base de datos desde la que se realiza el informe, especialmente si se trata de un subsistema fácilmente definible de la arquitectura general del almacén de datos. Sin embargo, es bastante razonable pensar que es la capa de informes orientada al usuario, especialmente si hay herramientas de generación de informes ad hoc como Business Objects u OLAP que permiten a los usuarios finales obtener los datos directamente.


Data Mart tradicionalmente ha significado datos estáticos, generalmente orientados a fecha / hora, utilizados por los analistas para estadísticas, presupuestos, informes de rendimiento y ventas, y otras actividades de planificación.

Un cubo es una base de datos OLAP que convierte de forma bastante exhaustiva los datos OLTP en un esquema estático, orientado a fecha / hora que utiliza un lenguaje de consulta que no es SQL, sino que está diseñado específicamente para responder preguntas del tipo de centro de datos. Utiliza términos como medidas, dimensiones, esquema de estrella, etc. en lugar de tablas, columnas y filas. La mejor analogía familiar podría ser tablas dinámicas en una hoja de cálculo.


El término "data mart" se ha vuelto algo ambiguo, pero tradicionalmente se lo asocia con un subconjunto orientado a temas de los sistemas de información de una organización. Data Mart no implica explícitamente la presencia de una tecnología multidimensional como OLAP y Data Mart no implica explícitamente la presencia de datos numéricos resumidos.

Un cubo, por otro lado, tiende a implicar que los datos se presentan usando una nomenclatura multidimensional (típicamente una tecnología OLAP) y que los datos generalmente se resumen como intersecciones de jerarquías múltiples. (es decir, el valor neto de su familia frente a su valor neto personal y todo lo demás) En general, "cubo" implica algo muy específico, mientras que "data mart" tiende a ser un poco más general.

Supongo que en el habla OOP se puede decir con precisión que un data mart "tiene un" cubo ", tiene una" base de datos relacional ", tiene una" interfaz de informes ingeniosa, etc. ... pero sería menos correcto decir que cualquiera de aquellos individualmente "is-a" data mart. El término data mart es más inclusivo.


Data Mart es una recopilación de datos de un proceso comercial específico. Es irrelevante cómo se almacenan los datos. Un cubo almacena datos de una manera especial, de múltiples dimensiones, a diferencia de una tabla con filas y columnas. Un cubo en una base de datos olap es como una tabla para una base de datos tradicional. Un centro de datos puede tener tablas o cubos. Los cubos hacen que el análisis sea más rápido porque precalcula las agregaciones con anticipación.


Estoy de acuerdo con Matthew. Tendemos a utilizar el término "Data Mart" para cualquier fuente de datos que almacene datos y mapeos genéricos utilizados en diversas aplicaciones en una empresa. No almacenamos datos mensurables en un mercado de datos, por lo que veo un mercado de datos como una de las múltiples fuentes de datos para un cubo. Esto, sin embargo, es cómo lo hacemos. Estoy seguro de que no hay nada que le impida almacenar datos mensurables en un mercado de datos.


Como su nombre lo sugiere, un cubo es un conjunto de datos multidimensional estructurado (típicamente tres dimensiones, cada una representando tres lados de un cubo). Una plataforma de datos es solo un contenedor y no una estructura en sí misma, aunque contiene conjuntos de datos organizados de forma plana (como tablas) en dimensiones y hechos.

La estructura de un cubo facilita la visualización o conceptualización de datos a lo largo de varias dimensiones de un cubo. Por lo tanto, a la mayoría de los analistas o desarrolladores de negocios les resulta fácil consultar e interactuar con el cubo.

Dado que un centro de datos es solo un contenedor con varias tablas; los usuarios necesitan primero conceptualizar y comprender estructuras dimensionales antes de consultar y analizar datos.


Recuerda:

Data Warehousing es el proceso de tomar datos de sistemas de bases de datos heredados y de transacciones y transformarlos en información organizada en un formato fácil de usar para fomentar el análisis de datos y respaldar la toma de decisiones basadas en hechos.

Un Data Warehouse es un sistema que extrae, limpia, conforma y entrega datos de origen en un almacén de datos dimensionales y luego admite e implementa consultas y análisis con el propósito de tomar decisiones.

KIMBALL, por ejemplo, consistentemente ha definido el mercado de datos como un subconjunto orientado al proceso de los datos de la organización en general sobre la base de datos atómicos, y eso depende únicamente de la física de los eventos de medición de datos, no de las preguntas anticipadas del usuario.

  • Los mercados de datos se basan en la fuente de datos, no en la vista de datos de un departamento.
  • Los mercados de datos contienen todos los detalles atómicos necesarios para soportar la perforación hasta el nivel más bajo.
  • Los mercados de datos se pueden controlar centralmente o descentralizar.

DEFINICIÓN CORRECTA

  • Basado en procesos
  • Fundación de Datos Atómicos
  • Medida de datos

DEFINICIÓN MISGUADA

  • Basado en el departamento
  • Datos agregados solamente
  • Basado en preguntas del usuario