database - tipos - ¿Qué es un almacén de datos?
para que sirve data warehouse (11)
Al menos en teoría, la idea de un almacén de datos es proporcionar una vista consolidada de los datos de una variedad de sistemas existentes, que generalmente se consideran poco prácticos para volver a escribir y consolidar los datos directamente. Por lo tanto, el almacén de datos recopila datos de esos sistemas existentes y proporciona (al menos la ilusión de) que todos los datos están en un solo lugar, por lo que se pueden consultar de una manera.
La intención principal es (generalmente) permitir la correlación entre los datos de los sistemas existentes. Por ejemplo, puede comparar cuánto tiempo pasó su representante de ventas con el cliente X (que está almacenado en un sistema) con la cantidad de clientes que compró X (almacenado en un segundo sistema) y cuán contento está el cliente X con lo que está recibiendo (almacenado, por supuesto, en un tercer sistema).
Desde un punto de vista práctico, a menudo significa que las ideas del cliente están en algún lugar entre mal definidas y completamente locas. El costo y el cronograma son casi imposibles de adivinar, y una estimación sólida es claramente imposible. Lograr lo que realmente quiere es casi imposible, y descubrir algo que será útil llevará suficiente tiempo y trabajo, que tu primer paso es hacer que lo que estás haciendo parezca lo suficientemente técnico para que no tenga corazón. atacar cuando tenga un indicio del costo y / o el horario.
Un cliente me preguntó qué significa realmente el término "almacén de datos".
Pensé en ETL, detalles del modelo de datos, diferencias con NoSQL, Clouds, DBMS ''normales'', MDM (Master Data Management), etc. pero no pude describir el término en pocas palabras para él ... (En De hecho, hablé un poco y lo dejé sin iluminación.
¿Cómo se puede describir el "almacén de datos" en 1-3 oraciones (o un poco más)?
BESO...
Un almacén de datos es un depósito de datos relacionados con una organización determinada y sus actividades. Estos datos permitirán el análisis y el informe del desempeño de la organización a través de varias dimensiones pertinentes, como el tiempo, la estructura y los flujos de actividad. Estas dimensiones se pueden combinar y los resultados se pueden agregar a través de jerarquías relevantes.
De wiki :
Un almacén de datos es un repositorio de los datos almacenados electrónicamente de una organización, diseñado para facilitar la presentación de informes y el análisis wiki .
Esta definición del almacén de datos se centra en el almacenamiento de datos. Sin embargo, los medios para recuperar y analizar datos, para extraer, transformar y cargar datos, y para administrar el diccionario de datos también se consideran componentes esenciales de un sistema de almacenamiento de datos. Muchas referencias al almacenamiento de datos utilizan este contexto más amplio. Por lo tanto, una definición ampliada para el almacenamiento de datos incluye herramientas de inteligencia empresarial, herramientas para extraer, transformar y cargar datos en el repositorio, y herramientas para administrar y recuperar metadatos.
Desde un punto de vista práctico: las empresas cambian, los entornos cambian, lo que fue una pregunta importante ayer, puede que no lo sea hoy y probablemente no lo sea mañana. Esto es especialmente cierto cuando se trata de preguntas a nivel de CEO.
Si no puede prever cuáles serán las preguntas, su única opción es proporcionar los medios para responder cualquier pregunta rápidamente. Eso es lo que los almacenes de datos intentan o pretenden hacer. De dónde provienen los datos y de cuántos sistemas dispares, es irrelevante.
Muchos almacenes de datos fallan en la "respuesta rápida a cualquier pregunta" porque su tecnología requiere que usted convierta los datos en bruto disponibles "de adentro hacia afuera" (haciendo cubos) para asegurar el "rápido". Y la definición de esos cubos restringe la variedad de preguntas que se pueden responder.
En lenguaje sencillo...
Un almacén de datos es una forma de controlar los artículos en un almacén real que contiene la ubicación de control, el stock, el movimiento, los informes, la auditoría, cualquier cosa sobre "artículos reales" en un "almacén real".
Espero que sea más sencillo.
Para los usuarios no técnicos, lo mejor es describirlo como "Gran cantidad de datos almacenados en un sistema informático especializado. Los datos generalmente están relacionados con algún dominio específico y todo el sistema está diseñado para ser rápido y optimizado para algunas tareas especiales. Los datos se almacenan en los datos Los almacenes se utilizan principalmente para análisis o en procesos de toma de decisiones ".
No estoy seguro de si esto es suficiente :) Hay muchas referencias a este tema en Internet, pero si alguien me pidiera una definición rápida, usaría algo similar a lo que escribí anteriormente.
Por lo que sé, el almacén de datos no es más que una base de datos relacional diseñada para consultas y análisis. Generalmente contiene datos históricos derivados de datos de transacciones.
Según William Inmon, la definición del almacén de datos es:
Data Warehouse es una recopilación de datos orientada al tema, integrada, no volátil y variable en el tiempo, que respalda las decisiones de la gerencia.
Y la definición anterior es lógica y perfecta si pensamos racionalmente y podemos entenderla desde here
Un almacén de datos es un intento de hacer que los sistemas dispares parezcan homogéneos, independientemente de la tecnología subyacente o el mecanismo de almacenamiento.
Podría entrar en el ''por qué'' del almacenamiento de datos, pero esa es una pregunta diferente.
Un almacén de datos es una base de datos relacional que está diseñada para consultas y análisis de negocios en lugar de para el procesamiento de transacciones. Contiene datos históricos derivados de datos de transacciones. Estos datos históricos son utilizados por los analistas de negocios para comprender en detalle el negocio.
Un almacén de datos debe tener las siguientes características:
- Orientado al tema:
Un almacén de datos ayuda a analizar los datos. Por ejemplo, para conocer las ventas de una empresa, un almacén de datos debe basarse en los datos de ventas. Usando este almacén de datos podemos encontrar las ventas del último año. Esta capacidad de definir un almacén de datos por tema (ventas) lo convierte en un tema orientado.
- Integrado:
Traer datos de diferentes fuentes y ponerlos en un formato consistente. Esto incluye resolver las unidades de medidas, nombrar conflictos, etc.
- No volátil:
Una vez que los datos entran en el almacén de datos, los datos no deben actualizarse.
- Variante de tiempo:
Para analizar el negocio, los analistas necesitan grandes cantidades de datos. Por lo tanto, el almacén de datos debe contener datos históricos.
Un almacén de datos es una base de datos, una carga de datos y un sistema de informes diseñado para agregar datos de múltiples fuentes y presentarlos de una manera que sea fácil de extraer e informar. Desde un punto de vista práctico, los beneficios de un proyecto exitoso de almacenamiento de datos son:
Informes estadísticos y financieros: los almacenes de datos facilitan el trabajo con datos en conjunto y obtienen análisis útiles de ellos, especialmente cuando tiene 65537 o más filas de datos.
Seguridad de los datos: los datos se comportan bien y no tienen trampas para los jugadores jóvenes. Los usuarios inexpertos pueden utilizar sistemas de informes ad-hoc con un bajo riesgo de producir resultados no válidos en los informes sin darse cuenta.
Transparencia: la empresa puede ver e identificar problemas con los datos en los sistemas subyacentes. Un almacén de datos puede ser una buena herramienta para impulsar el trabajo de calidad de datos.
Empoderamiento: las herramientas de generación de informes de los usuarios finales deben ser compatibles con la mayoría de los requisitos de información de gestión, ya que solo un conjunto mínimo requiere que un especialista técnico desarrolle un informe personalizado.
Wow, estaba haciendo algunas investigaciones. Esta es una muy buena respuesta que encontré:
El almacenamiento de datos ... es la versión reproducida de las transacciones de datos que están particularmente estructuradas y creadas para consultas, análisis e informes. En una definición muy simple, el término almacenamiento de datos se refiere al proceso de recopilación sistemática de datos que se almacenan de manera organizada para que se pueda acceder a ellos y recuperarlos para futuros informes y análisis de documentos.
Es de " Data Warehouse 100 Success Secrets " por Richard Martin