database - ventas - ¿Diferencia entre la tabla de hechos y la tabla de dimensiones?
modelo multidimensional data warehouse (7)
- La tabla de hechos consta principalmente de hechos comerciales y claves externas que se refieren a claves primarias en las tablas de dimensiones. Una tabla de dimensiones consta principalmente de atributos descriptivos que son campos textuales.
- Una tabla de dimensiones contiene una clave sustituta, una clave natural y un conjunto de atributos. Por el contrario, una tabla de hechos contiene una clave externa, medidas y dimensiones degeneradas.
- Las tablas de dimensiones proporcionan información descriptiva o contextual para la medición de una tabla de hechos. Por otro lado, las tablas de hechos proporcionan las medidas de una empresa.
- Cuando se compara el tamaño de las dos tablas, una tabla de hechos es más grande que una tabla dimensional. En una tabla de comparación, se presentan más dimensiones que las tablas de hechos. En una tabla de hechos, se observan menos números de hechos.
- La tabla de dimensiones debe cargarse primero. Al cargar las tablas de hechos, uno debería mirar la tabla de dimensiones. Esto se debe a que la tabla de hechos tiene medidas, hechos y claves externas que son las claves principales en la tabla de dimensiones.
Leer más: Tabla de dimensiones y Tabla de hechos | Diferencia entre | Tabla de dimensiones vs Tabla de hechos http://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo
Al leer un libro para objetos de negocios, encontré el término tabla de hechos y dimensiones.
¿Estoy tratando de entender cuál es la diferencia entre la tabla de dimensiones y la tabla de hechos?
Leí un par de artículos en Internet pero no pude entender claramente ...
¿Algún ejemplo simple me ayudará a entender mejor?
¡Esta parece ser una respuesta muy simple sobre cómo diferenciar entre tablas de hechos y de dimensiones!
Puede ayudar pensar las dimensiones como cosas u objetos. Una cosa como un producto puede existir sin estar involucrado en un evento de negocios. Una dimensión es tu sustantivo. Es algo que puede existir independientemente de un evento de negocios, como una venta. Productos, empleados, equipos, son todas las cosas que existen. Una dimensión hace algo, o tiene algo que se le ha hecho.
Los empleados venden, los clientes compran. Empleados y clientes son ejemplos de dimensiones, lo hacen.
Los productos se venden, también son dimensiones, ya que tienen algo para ellos.
Hechos, son el verbo. Una entrada en una tabla de hechos marca un evento discreto que sucede a algo de la tabla de dimensiones. Una venta de productos se registraría en una tabla de hechos. El evento de la venta se indicaría según qué producto se vendió, qué empleado lo vendió y qué cliente lo compró. Producto, empleado y cliente son todas las dimensiones que describen el evento, la venta.
Además, las tablas de hechos también suelen tener algún tipo de datos cuantitativos. La cantidad vendida, el precio por artículo, el precio total, etc.
Fuente: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/
En Data Warehouse Modeling, un esquema en estrella y un esquema de copo de nieve se componen de tablas de hechos y dimensiones .
Tabla de hechos:
- Contiene todas las claves principales de la dimensión y los hechos o medidas asociados (es una propiedad en la que se pueden realizar cálculos) como la cantidad vendida, la cantidad vendida y las ventas promedio.
Tablas de dimensiones:
- Las tablas de dimensiones proporcionan información descriptiva de todas las mediciones registradas en la tabla de hechos.
- Las dimensiones son relativamente muy pequeñas en comparación con la tabla de hechos.
- Las dimensiones más utilizadas son personas, productos, lugar y tiempo.
En la forma más simple, creo que una tabla de dimensiones es algo así como una tabla ''Maestra'', que mantiene una lista de todos los ''elementos'', por así decirlo.
Una tabla de hechos es una tabla de transacciones que describe todas las transacciones. Además, los datos agregados (agrupados) como las ventas totales por persona de ventas, las ventas totales por sucursal, este tipo de tablas también pueden existir como tablas de hechos independientes.
Encontré esta respuesta más fácil de entender desde la perspectiva de una persona que no sabe mucho de la terminología DB / DW.
http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm
Recomendaré pasar por esto primero y luego analizar la respuesta de Emmad Kareem para obtener más granularidad. Espero que sea de ayuda.
Esto es para responder a la parte:
¿Estaba tratando de entender si las tablas de dimensiones pueden ser tablas de hechos o no?
La respuesta corta (INMO) es No. Esto se debe a que los 2 tipos de tablas se crean por diferentes motivos. Sin embargo, desde la perspectiva del diseño de la base de datos, una tabla de dimensión podría tener una tabla principal como el caso con la tabla de hechos que siempre tiene una tabla de dimensión (o más) como principal. Además, las tablas de hechos se pueden agregar, mientras que las tablas de dimensiones no se agregan. Otra razón es que las tablas de hechos no deben actualizarse en su lugar, mientras que las tablas de dimensiones pueden actualizarse en algunos casos.
Más detalles:
Las tablas de hechos y dimensiones aparecen en lo que se conoce comúnmente como un esquema en estrella. Un propósito principal del esquema en estrella es simplificar un conjunto complejo de tablas normalizadas y consolidar los datos (posiblemente de diferentes sistemas) en una estructura de base de datos que se puede consultar de una manera muy eficiente.
En su forma más simple, contiene una tabla de hechos (Ejemplo: StoreSales) y una o más tablas de dimensiones. Cada entrada de Dimensión tiene 0,1 o más tablas de datos asociadas (Ejemplo de tablas de dimensión: Geografía, Artículo, Proveedor, Cliente, Hora, etc.). Sería válido también para la dimensión tener un padre, en cuyo caso el modelo es del tipo "Snow Flake". Sin embargo, los diseñadores intentan evitar este tipo de diseño, ya que causa más combinaciones que ralentizan el rendimiento. En el ejemplo de StoreSales, la dimensión Geography podría estar compuesta por las columnas (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)
En un modelo de Snow Flakes, podría tener 2 tablas normalizadas para información Geo, a saber: Tabla de contenido, Tabla de país.
Puedes encontrar muchos ejemplos en el esquema estelar. Además, verifique esto para ver una vista alternativa en el modelo de esquema en estrella Inmon vs. Kimball . Kimbal tiene un buen foro que también puede querer visitar aquí: Foro de Kimball .
Edición: Para responder a comentarios sobre ejemplos para 4NF:
- Ejemplo para una tabla de hechos que viola 4NF:
Información de ventas (ID, BranchID, SalesPersonID, ItemID, Amount, TimeID)
- Ejemplo para una tabla de hechos que no viola 4NF:
Ventas Agregadas (BranchID, TotalAmount)
Aquí la relación está en 4NF.
El último ejemplo es bastante raro.
Tabla de dimensiones: no es nada, pero podemos mantener información sobre la fecha caracterizada llamada tabla de dimensiones.
Ejemplo: Dimensión temporal, Dimensión del producto.
Tabla de hechos: no es nada, pero podemos mantener información sobre las métricas o los datos de precálculo.
Ejemplo: Datos de ventas, Datos de pedidos.
Esquema en estrella: un enlace de tabla de hechos con forma de tabla de dimensión como un esquema de inicio.