SAP HANA - Modelador de información
Modelador de información de SAP HANA; también conocido como HANA Data Modeler es el corazón del sistema HANA. Permite crear vistas de modelado en la parte superior de las tablas de la base de datos e implementar la lógica empresarial para crear un informe significativo para el análisis.
Características de Information Modeler
Proporciona múltiples vistas de los datos transaccionales almacenados en tablas físicas de la base de datos HANA para fines de análisis y lógica empresarial.
El modelador informativo solo funciona para tablas de almacenamiento basadas en columnas.
Las vistas de modelado de información son consumidas por aplicaciones basadas en Java o HTML o herramientas SAP como SAP Lumira o Analysis Office para fines de generación de informes.
También es posible utilizar herramientas de terceros como MS Excel para conectarse a HANA y crear informes.
Las vistas de modelado de SAP HANA explotan el poder real de SAP HANA.
Hay tres tipos de vistas de información, definidas como:
- Vista de atributos
- Vista analítica
- Vista de cálculo
Almacén de fila vs columna
Las vistas de SAP HANA Modeler solo se pueden crear en la parte superior de las tablas basadas en columnas. El almacenamiento de datos en tablas de columnas no es algo nuevo. Anteriormente se asumió que almacenar datos en una estructura basada en columnas requiere más tamaño de memoria y no un rendimiento optimizado.
Con la evolución de SAP HANA, HANA utilizó el almacenamiento de datos basado en columnas en las vistas de información y presentó los beneficios reales de las tablas en columnas sobre las tablas basadas en filas.
Column Store
En una tabla de almacenamiento de columnas, los datos se almacenan verticalmente. Entonces, tipos de datos similares se juntan como se muestra en el ejemplo anterior. Proporciona operaciones de lectura y escritura de memoria más rápidas con la ayuda de In-Memory Computing Engine.
En una base de datos convencional, los datos se almacenan en una estructura basada en filas, es decir, horizontalmente. SAP HANA almacena datos en una estructura basada en filas y columnas. Esto proporciona optimización del rendimiento, flexibilidad y compresión de datos en la base de datos HANA.
El almacenamiento de datos en una tabla basada en columnas tiene los siguientes beneficios:
Compresión de datos
Acceso de lectura y escritura a tablas más rápido en comparación con el almacenamiento convencional basado en filas
Flexibilidad y procesamiento paralelo
Realice agregaciones y cálculos a mayor velocidad
Existen varios métodos y algoritmos para almacenar datos en una estructura basada en columnas: diccionario comprimido, longitud de ejecución comprimida y muchos más.
En Dictionary Compressed, las celdas se almacenan en forma de números en tablas y las celdas numéricas siempre tienen un rendimiento optimizado en comparación con los caracteres.
En Run length comprimido, guarda el multiplicador con el valor de la celda en formato numérico y el multiplicador muestra el valor repetitivo en la tabla.
Diferencia funcional: almacenamiento de filas y columnas
Siempre es recomendable utilizar el almacenamiento basado en columnas, si la declaración SQL tiene que realizar funciones y cálculos agregados. Las tablas basadas en columnas siempre funcionan mejor cuando se ejecutan funciones agregadas como Sum, Count, Max, Min.
Se prefiere el almacenamiento basado en filas cuando la salida debe devolver una fila completa. El ejemplo que se da a continuación lo hace fácil de entender.
En el ejemplo anterior, mientras ejecuta una función agregada (Suma) en la columna de ventas con la cláusula Where, solo usará la columna Fecha y Ventas mientras ejecuta la consulta SQL, por lo que si se trata de una tabla de almacenamiento basada en columnas, se optimizará el rendimiento, más rápido como datos se requiere solo de dos columnas.
Mientras se ejecuta una consulta de selección simple, la fila completa debe imprimirse en la salida, por lo que es aconsejable almacenar la tabla como fila basada en este escenario.
Vistas de modelado de información
Vista de atributos
Los atributos son elementos no medibles en una tabla de base de datos. Representan datos maestros y similares a las características de BW. Las vistas de atributos son dimensiones en una base de datos o se utilizan para unir dimensiones u otras vistas de atributos en el modelado.
Las características importantes son:
- Las vistas de atributos se utilizan en vistas analíticas y de cálculo.
- La vista de atributos representa datos maestros.
- Se utiliza para filtrar el tamaño de las tablas de dimensiones en la vista Analítica y de cálculo.
Vista analítica
Las vistas analíticas utilizan el poder de SAP HANA para realizar cálculos y funciones de agregación en las tablas de la base de datos. Tiene al menos una tabla de hechos que tiene medidas y claves primarias de tablas de dimensiones y rodeada de tablas de dimensiones que contienen datos maestros.
Las características importantes son:
Las vistas analíticas están diseñadas para realizar consultas de esquema en estrella.
Las vistas analíticas contienen al menos una tabla de hechos y varias tablas de dimensiones con datos maestros y realizan cálculos y agregaciones.
Son similares a los cubos de información y los objetos de información en SAP BW.
Las vistas analíticas se pueden crear sobre vistas de atributos y tablas de hechos y realizan cálculos como el número de unidades vendidas, el precio total, etc.
Vistas de cálculo
Las vistas de cálculo se utilizan además de las vistas analíticas y de atributos para realizar cálculos complejos, que no son posibles con las vistas analíticas. La vista de cálculo es una combinación de tablas de columnas base, vistas de atributos y vistas analíticas para proporcionar lógica empresarial.
Las características importantes son:
Las vistas de cálculo se definen de forma gráfica mediante la función de modelado de HANA o mediante secuencias de comandos en SQL.
Está creado para realizar cálculos complejos, que no son posibles con otras vistas: vistas de atributos y analíticas del modelador de SAP HANA.
Una o más vistas de atributos y vistas analíticas se consumen con la ayuda de funciones integradas como Proyectos, Unión, Unión, Clasificación en una Vista de cálculo.