SAP BODS: técnicas de ajuste

El rendimiento de un trabajo ETL depende del sistema en el que esté utilizando el software de servicios de datos, el número de movimientos, etc.

Hay varios otros factores que contribuyen al desempeño en una tarea ETL. Ellos son -

  • Source Data Base - La base de datos de origen debe configurarse para realizar Selectdeclaraciones rápidamente. Esto se puede hacer aumentando el tamaño de la E / S de la base de datos, aumentando el tamaño del búfer compartido para almacenar en caché más datos y no permitiendo el paralelo para tablas pequeñas, etc.

  • Source Operating System- El sistema operativo de origen debe configurarse para leer los datos rápidamente de los discos. Establezca el protocolo de lectura anticipada en 64 KB.

  • Target Database - La base de datos de destino debe estar configurada para realizar INSERT y UPDATEcon rapidez. Esto se puede hacer mediante:

    • Deshabilitar el registro de archivo.
    • Deshabilitar el registro de rehacer para todas las tablas.
    • Maximización del tamaño del búfer compartido.
  • Target Operating System- El sistema operativo de destino debe configurarse para escribir los datos en los discos rápidamente. Puede activar la E / S asíncrona para que las operaciones de entrada / salida sean lo más rápidas posible.

  • Network - El ancho de banda de la red debería ser suficiente para transferir los datos del sistema de origen al de destino.

  • BODS Repository Database - Para mejorar el rendimiento de los trabajos BODS, se puede realizar lo siguiente:

    • Monitor Sample Rate - En caso de que esté procesando una gran cantidad de datos establecidos en un trabajo ETL, controle la frecuencia de muestreo a un valor más alto para reducir el número de llamadas de E / S al archivo de registro y mejorar así el rendimiento.

    • También puede excluir los registros de servicios de datos del análisis de virus si el análisis de virus está configurado en el servidor de trabajo, ya que puede causar una degradación del rendimiento.

  • Job Server OS - En Servicios de datos, un flujo de datos en un trabajo inicia uno ‘al_engine’proceso, que inicia cuatro subprocesos. Para obtener el máximo rendimiento, considere un diseño que ejecute uno‘al_engine’proceso por CPU a la vez. El sistema operativo del servidor de trabajos debe ajustarse de tal manera que todos los subprocesos se distribuyan a todas las CPU disponibles.