SAP BODS - Transformación de consultas
Esta es la transformación más común utilizada en los servicios de datos y puede realizar las siguientes funciones:
- Filtrado de datos de fuentes
- Uniendo datos de múltiples fuentes
- Realizar funciones y transformaciones en datos
- Mapeo de columnas de esquemas de entrada a salida
- Asignación de claves primarias
- Agregar nuevas columnas, esquemas y funciones como resultado de los esquemas de salida
Dado que la transformación de consulta es la transformación más utilizada, se proporciona un acceso directo para esta consulta en la paleta de herramientas.
Para agregar la transformación de consulta, siga los pasos que se indican a continuación:
Step 1- Haga clic en la paleta de herramientas de transformación de consultas. Haga clic en cualquier lugar del espacio de trabajo Flujo de datos. Conéctelo a las entradas y salidas.
Cuando hace doble clic en el icono de transformación de consultas, se abre un editor de consultas que se utiliza para realizar operaciones de consulta.
Las siguientes áreas están presentes en la transformación de consultas:
- Esquema de entrada
- Esquema de salida
- Parameters
Los esquemas de entrada y salida contienen columnas, esquemas anidados y funciones. Schema In y Schema Out muestra el esquema seleccionado actualmente en transformación.
Para cambiar el esquema de salida, seleccione el esquema en la lista, haga clic con el botón derecho y seleccione Convertir en actual.
Transformación de la calidad de los datos
Las transformaciones de calidad de datos no se pueden conectar directamente a la transformación anterior, que contiene tablas anidadas. Para conectar estas transformaciones, debe agregar una transformación de consulta o una transformación de canalización XML entre la transformación de la tabla anidada y la transformación de calidad de datos.
¿Cómo utilizar la transformación de la calidad de datos?
Step 1 - Ir a Biblioteca de objetos → pestaña Transformar
Step 2 - Expanda la transformación de Calidad de datos y agregue la transformación o la configuración de transformación que desea agregar al flujo de datos.
Step 3- Dibujar las conexiones del flujo de datos. Haga doble clic en el nombre de la transformación, se abre el editor de transformación. En el esquema de entrada, seleccione los campos de entrada que desea asignar.
Note - Para usar Associate Transform, puede agregar campos definidos por el usuario a la pestaña de entrada.
Transformación de procesamiento de datos de texto
Transformación de procesamiento de datos de texto le permite extraer la información específica de un gran volumen de texto. Puede buscar hechos y entidades como clientes, productos y hechos financieros, específicos de una organización.
Esta transformación también verifica la relación entre entidades y permite la extracción. Los datos extraídos, mediante el procesamiento de datos de texto, se pueden utilizar en inteligencia empresarial, informes, consultas y análisis.
Transformación de extracción de entidad
En los servicios de datos, el procesamiento de datos de texto se realiza con la ayuda de Entity Extraction, que extrae entidades y hechos de datos no estructurados.
Esto implica analizar y procesar un gran volumen de datos de texto, buscar entidades, asignarlas al tipo apropiado y presentar metadatos en formato estándar.
La transformación Entity Extraction puede extraer información de cualquier texto, HTML, XML o cierto contenido de formato binario (como PDF) y generar una salida estructurada. Puede utilizar la salida de varias formas según su flujo de trabajo. Puede usarlo como entrada para otra transformación o escribir en múltiples fuentes de salida, como una tabla de base de datos o un archivo plano. La salida se genera en codificación UTF-16.
Entity Extract Transform can be used in the following scenarios −
Encontrar una información específica a partir de una gran cantidad de texto.
Encontrar información estructurada a partir de texto no estructurado con información existente para establecer nuevas conexiones.
Elaboración de informes y análisis de la calidad del producto.
Diferencias entre TDP y limpieza de datos
El procesamiento de datos de texto se utiliza para encontrar información relevante a partir de datos de texto no estructurados. Sin embargo, la limpieza de datos se utiliza para estandarizar y limpiar datos estructurados.
Parámetros | Procesamiento de datos de texto | Limpieza de datos |
---|---|---|
Tipo de entrada | Datos no estructurados | Datos estructurados |
Tamaño de entrada | Más de 5 KB | Menos de 5 KB |
Alcance de entrada | Dominio amplio con muchas variaciones | Variaciones limitadas |
Uso potencial | Información significativa potencial de datos no estructurados | Calidad de los datos para almacenar en el repositorio |
Salida | Cree anotaciones en forma de entidades, tipo, etc. La entrada no se modifica | Crear campos estandarizados, la entrada se cambia |