Almacenamiento de datos: preguntas de la entrevista
Estimados lectores, estos Data Warehousing Interview Questions han sido diseñados especialmente para familiarizarlo con la naturaleza de las preguntas que puede encontrar durante su entrevista para el tema de Data Warehousing.
A : El almacén de datos es una recopilación de datos no volátil, integrada, variable en el tiempo y orientada al tema que respalda el proceso de toma de decisiones de la administración.
A : Orientado al tema significa que el almacén de datos almacena la información sobre un tema en particular, como producto, cliente, ventas, etc.
A : Algunas aplicaciones incluyen servicios financieros, servicios bancarios, productos para clientes, sectores minoristas, fabricación controlada.
A : OLAP es un acrónimo de Online Analytical Processing y OLTP es un acrónimo de procesamiento transaccional en línea.
A : Un almacén de datos contiene información histórica que está disponible para el análisis del negocio, mientras que una base de datos operativa contiene información actual que se requiere para ejecutar el negocio.
A : Un almacén de datos puede implementar un esquema en estrella, un esquema de copo de nieve y un esquema de constelación de hechos.
A : El almacenamiento de datos es el proceso de construcción y uso del almacenamiento de datos.
A : El almacenamiento de datos implica la limpieza, la integración y la consolidación de datos.
A : Las funciones que realiza la herramienta de almacenamiento de datos y las utilidades son Extracción de datos, Limpieza de datos, Transformación de datos, Carga de datos y Actualización.
A : La extracción de datos significa recopilar datos de múltiples fuentes heterogéneas.
A: Los metadatos se definen simplemente como datos sobre datos. En otras palabras, podemos decir que los metadatos son los datos resumidos que nos llevan a los datos detallados.
A : Los metadatos respiratorios contienen la definición de almacén de datos, metadatos comerciales, metadatos operativos, datos para mapear desde el entorno operativo al almacén de datos y los algoritmos para el resumen.
A: El cubo de datos nos ayuda a representar los datos en múltiples dimensiones. El cubo de datos se define por dimensiones y hechos.
A : Las dimensiones son las entidades con respecto a las cuales una empresa mantiene los registros.
A: Data mart contiene el subconjunto de datos de toda la organización. Este subconjunto de datos es valioso para grupos específicos de una organización. En otras palabras, podemos decir que una despensa de datos contiene datos específicos de un grupo en particular.
A : La vista sobre un almacén de datos operativo se conoce como almacén virtual.
A : Las etapas son estrategia de TI, educación, análisis de casos de negocios, plano técnico, compilación de la versión, carga de historial, consulta ad hoc, evolución de requisitos, automatización y ampliación del alcance.
A: Un administrador de carga realiza las operaciones necesarias para extraer y cargar el proceso. El tamaño y la complejidad del administrador de carga varía entre soluciones específicas, desde el almacén de datos hasta el almacén de datos.
A: Un administrador de carga extrae datos del sistema de origen. Cargue rápidamente los datos extraídos en un almacén de datos temporal. Realice transformaciones simples en una estructura similar a la del almacén de datos.
A: El gerente de almacén es responsable del proceso de gestión del almacén. El administrador del almacén consta de software de sistema de terceros, programas C y scripts de shell. El tamaño y la complejidad del gerente de almacén varía entre soluciones específicas.
A : El administrador del almacén realiza verificaciones de coherencia e integridad referencial, crea los índices, vistas comerciales, vistas de particiones contra los datos base, transforma y fusiona los datos de origen en el almacén temporal en el almacén de datos publicado, realiza una copia de seguridad de los datos en el almacén de datos, y archiva los datos que han llegado al final de su vida útil capturada.
A : La información resumida es el área del almacén de datos donde se guardan las agregaciones predefinidas.
A : Query Manager es responsable de dirigir las consultas a las tablas adecuadas.
A : Hay cuatro tipos de servidores OLAP, a saber, OLAP relacional, OLAP multidimensional, OLAP híbrido y servidores SQL especializados.
A : OLAP multidimensional es más rápido que OLAP relacional.
A : OLAP realiza funciones como acumular, profundizar, cortar, cortar en dados y pivotar.
A : Solo se selecciona una dimensión para la operación de corte.
A : Para la operación de dados, se seleccionan dos o más dimensiones para un cubo dado.
A : Solo hay una tabla de hechos en un esquema en estrella.
A : La normalización divide los datos en tablas adicionales.
A : El esquema de copo de nieve utiliza el concepto de normalización.
A : La normalización ayuda a reducir la redundancia de datos.
A : El lenguaje de consulta de minería de datos (DMQL) se utiliza para la definición de esquemas.
A : DMQL se basa en Structured Query Language (SQL).
A : El particionamiento se realiza por varias razones, como la fácil administración, para ayudar a la recuperación de copias de seguridad, para mejorar el rendimiento.
A : Data Marting implica costos de hardware y software, costos de acceso a la red y costos de tiempo.