SAP HANA: creación de perfiles de datos SQL
La tarea de creación de perfiles de datos SQL se utiliza para comprender y analizar datos de múltiples fuentes de datos. Se utiliza para eliminar datos incorrectos e incompletos y evitar problemas de calidad de los datos antes de que se carguen en el almacén de datos.
Estos son los beneficios de las tareas de creación de perfiles de datos SQL:
Ayuda a analizar los datos de origen de forma más eficaz.
Ayuda a comprender mejor los datos de origen.
Elimina datos incorrectos e incompletos y mejora la calidad de los datos antes de que se carguen en el almacén de datos.
Se utiliza con tareas de extracción, transformación y carga.
La tarea de creación de perfiles de datos verifica los perfiles que ayudan a comprender una fuente de datos e identificar problemas en los datos que deben corregirse.
Puede usar la tarea de creación de perfiles de datos dentro de un paquete de Integration Services para perfilar los datos almacenados en SQL Server y para identificar problemas potenciales con la calidad de los datos.
Note - La tarea de creación de perfiles de datos solo funciona con fuentes de datos de SQL Server y no admite ninguna otra fuente de datos basada en archivos o de terceros.
Requisito de acceso
Para ejecutar una tarea de creación de perfiles de datos que contiene un paquete, la cuenta de usuario debe tener permisos de lectura / escritura con permisos CREATE TABLE en la base de datos tempdb.
Visor de perfil de datos
El Visor de perfiles de datos se utiliza para revisar la salida del generador de perfiles. El Visor de perfiles de datos también admite la capacidad de desglose para ayudarlo a comprender los problemas de calidad de los datos que se identifican en la salida del perfil. Esta capacidad de desglose envía consultas en vivo a la fuente de datos original.
Configuración y revisión de tareas de generación de perfiles de datos
Configuración de la tarea de creación de perfiles de datos
Implica la ejecución de un paquete que contiene la tarea de creación de perfiles de datos para calcular los perfiles. La tarea guarda la salida en formato XML en un archivo o una variable de paquete.
Revisar los perfiles
Para ver los perfiles de datos, envíe la salida a un archivo y luego use el Visor de perfiles de datos. Este visor es una utilidad independiente que muestra la salida del perfil en formato de resumen y detalle con capacidad de desglose opcional.
Creación de perfiles de datos: opciones de configuración
La tarea de creación de perfiles de datos tiene estas convenientes opciones de configuración:
Columnas comodín
Al configurar una solicitud de perfil, la tarea acepta el comodín '*' en lugar de un nombre de columna. Esto simplifica la configuración y facilita el descubrimiento de las características de los datos desconocidos. Cuando se ejecuta la tarea, la tarea perfila cada columna que tiene un tipo de datos apropiado.
Perfil rápido
Puede seleccionar Perfil rápido para configurar la tarea rápidamente. Un perfil rápido perfila una tabla o vista utilizando todos los perfiles y configuraciones predeterminados.
La tarea de creación de perfiles de datos puede calcular ocho perfiles de datos diferentes. Cinco de estos perfiles pueden verificar columnas individuales y los tres restantes analizar múltiples columnas o relaciones entre columnas.
Creación de perfiles de datos: salidas de tareas
La tarea de creación de perfiles de datos genera los perfiles seleccionados en formato XML que está estructurado como el esquema DataProfile.xsd.
Puede guardar una copia local del esquema y ver la copia local del esquema en Microsoft Visual Studio u otro editor de esquemas, en un editor XML o en un editor de texto como el Bloc de notas.