ETL vs prueba de base de datos
Tanto las pruebas ETL como las pruebas de bases de datos implican la validación de datos, pero no son lo mismo. Las pruebas ETL se realizan normalmente en datos en un sistema de almacenamiento de datos, mientras que las pruebas de bases de datos se realizan comúnmente en sistemas transaccionales donde los datos provienen de diferentes aplicaciones en la base de datos transaccional.
Aquí, hemos resaltado las principales diferencias entre las pruebas ETL y las pruebas de bases de datos.
Pruebas ETL
La prueba ETL implica las siguientes operaciones:
Validación del movimiento de datos desde el sistema de origen al de destino.
Verificación del recuento de datos en el sistema de origen y destino.
Verificación de extracción de datos, transformación según requerimiento y expectativa.
Verificar si las relaciones de la tabla (uniones y claves) se conservan durante la transformación.
Las herramientas de prueba de ETL comunes incluyen QuerySurge, Informaticaetc.
Prueba de base de datos
Las pruebas de bases de datos enfatizan más la precisión de los datos, la corrección de los datos y los valores válidos. Implica las siguientes operaciones:
Verificar si se mantienen las claves primarias y externas.
Verificar si las columnas de una tabla tienen valores de datos válidos.
Verificación de la precisión de los datos en columnas. Example - La columna de número de meses no debe tener un valor superior a 12.
Verificación de datos faltantes en columnas. Compruebe si hay columnas nulas que realmente deberían tener un valor válido.
Las herramientas de prueba de bases de datos comunes incluyen Selenium, QTPetc.
La siguiente tabla captura las características clave de las pruebas de base de datos y ETL y su comparación:
Función | Prueba de base de datos | Pruebas ETL |
---|---|---|
Objetivo principal | Integración y validación de datos | Extracción, transformación y carga de datos para informes de BI |
Sistema aplicable | Sistema transaccional donde ocurre el flujo de negocios | Sistema que contiene datos históricos y no en un entorno de flujo empresarial |
Herramientas comunes | QTP, Selenio, etc. | QuerySurge, Informatica, etc. |
Necesidad de Negocios | Se utiliza para integrar datos de múltiples aplicaciones, Severo impacto. | Se utiliza para informes analíticos, información y previsiones. |
Modelado | Método ER | Multidimensional |
Tipo de base de datos | Normalmente se utiliza en sistemas OLTP. | Se aplica a sistemas OLAP |
Tipo de datos | Datos normalizados con más uniones | Datos desnormalizados con menos combinaciones, más índices y agregaciones. |