database - traduccion - ¿Cuál es la diferencia entre una base de datos y un almacén de datos?
para que sirve data warehouse (10)
Cualquier almacenamiento de datos para la aplicación generalmente utiliza la base de datos. Podría ser una base de datos relacional o ninguna base de datos SQL que actualmente esté en tendencia.
El almacén de datos también es una base de datos. Podemos llamar a la base de datos del almacén de datos como almacenamiento de datos especializado para fines de informes analíticos para la empresa. Esta información se usó para una decisión comercial clave.
La información organizada ayuda a informar y tomar decisiones comerciales de manera efectiva.
¿Cuál es la diferencia entre una base de datos y un almacén de datos?
¿No son lo mismo, o al menos están escritos en la misma cosa (es decir, Oracle RDBMS)?
Desde una vista no técnica: una base de datos está restringida a aplicaciones o conjuntos de aplicaciones en particular.
Un almacén de datos es un repositorio de datos de nivel empresarial. Va a contener datos de todos / muchos segmentos del negocio. Compartirá esta información para proporcionar una imagen global del negocio. También es fundamental para la integración entre los diferentes segmentos del negocio.
Desde una vista técnica: La palabra "Almacén de datos" no recibió una definición reconocida. Personalmente, defino un almacén de datos como una colección de data-marts. Donde cada data-mart consta de una o más bases de datos donde la base de datos es específica para un conjunto de problemas específico (aplicación, conjunto de datos o proceso).
Simplemente ponga una base de datos es un componente de un almacén de datos. Hay muchos lugares para explorar este concepto, pero debido a que no existe una "definición", encontrará desafíos con cualquier respuesta que brinde.
Ejemplo: una casa vale $100,000
, y se está apreciando en $1000
por año.
Para realizar un seguimiento del valor actual de la casa, usaría una base de datos ya que el valor cambiaría cada año.
Tres años después, podrá ver el valor de la casa, que es de $103,000.
Para realizar un seguimiento del valor histórico de la casa, debe usar un almacén de datos ya que el valor de la casa debe ser
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.
La base de datos y el almacén de datos son los mismos porque encontraremos datos de manera organizada en ambos. Pero espera...
OLTP (procesamiento de transacciones en línea) o podemos decir el sistema operativo que proporciona la facilidad de transacción diaria en una organización. Las bases de datos se utilizan para este tipo de trabajo (OLTP o sistema operacional).
P. ¿Qué estamos haciendo en el entorno del sistema operacional?
** estamos eliminando, actualizando, insertando registros para los clientes de la base de datos. Paralelamente, en todos los datos del OLTP (sistema operacional) se realiza la transformación (extracción, agregación, limpieza) y los datos se almacenan en un almacén para que el gerente y los ejecutivos los respalden en la toma de decisiones, en el establecimiento de objetivos. y objetivos para sus negocios.
Por lo tanto, el almacén de datos de conclusión es un lugar donde los datos deben estar en una forma organizada, como la base de datos, pero debe proporcionar información estratégica (información para hacer una estrategia comercial, información para establecer metas / objetivos).
La forma más sencilla de explicarlo sería decir que un almacén de datos consiste en algo más que una base de datos. Una base de datos es una colección de datos organizados de alguna manera, pero un almacén de datos está organizado específicamente para "facilitar la elaboración de informes y el análisis". Sin embargo, esta no es toda la historia, ya que el almacenamiento de datos también contiene "los medios para recuperar y analizar datos, extraer, transformar y cargar datos, y administrar el diccionario de datos también se consideran componentes esenciales de un sistema de almacenamiento de datos".
Mira this para más información.
De un enlace anterior:
Base de datos
- Se utiliza para el procesamiento transaccional en línea ( OLTP ) pero puede usarse para otros fines, como el almacenamiento de datos. Esto registra los datos del usuario para el historial.
- Las tablas y combinaciones son complejas ya que están normalizadas (para RDMS ). Esto se hace para reducir los datos redundantes y para ahorrar espacio de almacenamiento.
- Entidad: las técnicas de modelado relacional se utilizan para el diseño de la base de datos RDMS.
- Optimizado para la operación de escritura.
- El rendimiento es bajo para las consultas de análisis.
Almacén de datos
- Utilizado para procesamiento analítico en línea ( OLAP ). Esto lee los datos históricos de los usuarios para las decisiones comerciales.
- Las tablas y las uniones son simples ya que están des-normalizadas. Esto se hace para reducir el tiempo de respuesta para consultas analíticas.
- Datos: las técnicas de modelado se utilizan para el diseño del Almacén de datos.
- Optimizado para operaciones de lectura.
- Alto rendimiento para consultas analíticas.
- Usualmente es una base de datos.
También es importante tener en cuenta que Data Warehouses podría obtenerse de cero a muchas bases de datos.
Un depósito de datos es un TIPO de base de datos.
Además de lo que la gente ya ha dicho, los data warehouses tienden a ser OLAP, con índices, etc. ajustados para leer, no escribir, y los datos se des-normalizan / transforman en formularios que son más fáciles de leer y analizar.
Algunas personas han dicho que las "bases de datos" son las mismas que OLTP; esto no es cierto. OLTP, nuevamente, es un TIPO de base de datos.
Otros tipos de "bases de datos": archivos de texto, XML, Excel, CSV ..., archivos planos :-)
Vea en palabras simples: Dataware -> Enorme información usando para Analítica / almacenamiento / copia y Análisis. Base de datos -> Operación CRUD con datos utilizados con frecuencia.
La casa de Dataware es un tipo de almacenamiento que no está utilizando a diario y la base de datos es algo que trata con frecuencia.
P.ej. Si estamos pidiendo declaración de banco, entonces nos da los últimos 3/4/6 / meses porque está en la base de datos. Si quieres más que eso, almacena en la casa de Dataware.
Almacén de datos vs base de datos: un almacén de datos está especialmente diseñado para el análisis de datos, que implica la lectura de grandes cantidades de datos para comprender las relaciones y tendencias en los datos. Una base de datos se utiliza para capturar y almacenar datos, como la grabación de detalles de una transacción.
Almacén de datos: cargas de trabajo adecuadas : análisis, informes y big data. Fuente de datos : datos recopilados y normalizados de muchas fuentes. Captura de datos : operaciones de escritura masiva generalmente en un cronograma de lote predeterminado. Normalización de datos : esquemas desnormalizados, como el esquema Star o el esquema Snowflake. Almacenamiento de datos : optimizado para simplificar el acceso y la consulta a alta velocidad. rendimiento utilizando almacenamiento columnar. Acceso a datos : optimizado para minimizar la E / S y maximizar el rendimiento de los datos.
Base de datos transaccional: cargas de trabajo adecuadas: procesamiento de transacción. Fuente de datos : datos capturados como son de una sola fuente, como un sistema transaccional. Captura de datos : optimizada para operaciones de escritura continua a medida que hay nuevos datos disponibles para maximizar el rendimiento de la transacción. Normalización de datos : esquemas estáticos altamente normalizados. Almacenamiento de datos : optimizado para altas operaciones de escritura en un solo bloque físico orientado a filas. Acceso a datos : grandes volúmenes de pequeñas operaciones de lectura.
DataBase : - OLTP (proceso de transacción en línea)
- Son datos actuales, datos detallados actualizados, datos planos relacionales aislados.
- La relación de entidad se usa para diseñar la base de datos
- Tamaño de base 100MB-GB transacción simple o quires
Almacén de datos
- OLAP (proceso analítico en línea)
- Se trata de datos históricos, esquema de estrella, esquema de nieve flexionada y galaxia
- el esquema se usa para diseñar el almacén de datos
- Tamaño de DB 100GB-TB Base de rendimiento de consulta mejorada para VISUALIZACIÓN DE DATOS DE MINERÍA DE DATOS
- Permite a los usuarios obtener una comprensión y conocimiento más profundos sobre diversos aspectos de sus datos corporativos a través de un acceso rápido, consistente e interactivo a una amplia variedad de vistas posibles de los datos