Almacenamiento de datos: seguridad

El objetivo de un almacén de datos es hacer que grandes cantidades de datos sean fácilmente accesibles para los usuarios, lo que les permite extraer información sobre la empresa en su conjunto. Pero sabemos que podría haber algunas restricciones de seguridad aplicadas a los datos que pueden ser un obstáculo para acceder a la información. Si el analista tiene una vista restringida de los datos, entonces es imposible capturar una imagen completa de las tendencias dentro del negocio.

Los datos de cada analista se pueden resumir y pasar a la gerencia, donde se pueden agregar los diferentes resúmenes. Como las agregaciones de resúmenes no pueden ser las mismas que las de la agregación como un todo, es posible que se pierdan algunas tendencias de información en los datos a menos que alguien esté analizando los datos como un todo.

Requerimientos de seguridad

La incorporación de funciones de seguridad afecta el rendimiento del almacén de datos, por lo que es importante determinar los requisitos de seguridad lo antes posible. Es difícil agregar funciones de seguridad después de que el almacén de datos se haya activado.

Durante la fase de diseño del almacén de datos, debemos tener en cuenta qué fuentes de datos se pueden agregar más adelante y cuál sería el impacto de agregar esas fuentes de datos. Deberíamos considerar las siguientes posibilidades durante la fase de diseño.

  • ¿Las nuevas fuentes de datos requerirán la implementación de nuevas restricciones de seguridad y / o auditoría?

  • ¿Se agregaron nuevos usuarios que tienen acceso restringido a datos que ya están disponibles en general?

Esta situación surge cuando los futuros usuarios y las fuentes de datos no son bien conocidos. En tal situación, necesitamos utilizar el conocimiento del negocio y el objetivo del almacén de datos para conocer los requisitos probables.

Las siguientes actividades se ven afectadas por las medidas de seguridad:

  • Acceso de usuario
  • Carga de datos
  • Movimiento de datos
  • Generación de consultas

Acceso de usuario

Primero debemos clasificar los datos y luego clasificar a los usuarios en función de los datos a los que pueden acceder. En otras palabras, los usuarios se clasifican según los datos a los que pueden acceder.

Data Classification

Los siguientes dos enfoques se pueden utilizar para clasificar los datos:

  • Los datos se pueden clasificar según su sensibilidad. Los datos altamente sensibles se clasifican como altamente restringidos y los datos menos sensibles se clasifican como menos restrictivos.

  • Los datos también se pueden clasificar según la función laboral. Esta restricción permite que solo usuarios específicos vean datos particulares. Aquí restringimos a los usuarios para que vean solo la parte de los datos en la que están interesados ​​y son responsables.

Hay algunos problemas en el segundo enfoque. Para entender, veamos un ejemplo. Suponga que está construyendo el almacén de datos para un banco. Tenga en cuenta que los datos que se almacenan en el almacén de datos son los datos de la transacción de todas las cuentas. La pregunta aquí es quién puede ver los datos de la transacción. La solución radica en clasificar los datos según la función.

User classification

Se pueden usar los siguientes enfoques para clasificar a los usuarios:

  • Los usuarios pueden clasificarse según la jerarquía de usuarios en una organización, es decir, los usuarios pueden clasificarse por departamentos, secciones, grupos, etc.

  • Los usuarios también pueden clasificarse según su función, con personas agrupadas en departamentos según su función.

Classification on basis of Department

Veamos un ejemplo de un almacén de datos donde los usuarios son del departamento de ventas y marketing. Podemos tener seguridad mediante una vista de empresa de arriba a abajo, con acceso centrado en los diferentes departamentos. Pero podría haber algunas restricciones para los usuarios en diferentes niveles. Esta estructura se muestra en el siguiente diagrama.

Pero si cada departamento accede a datos diferentes, entonces deberíamos diseñar el acceso de seguridad para cada departamento por separado. Esto se puede lograr mediante mercados de datos departamentales. Dado que estos mercados de datos están separados del almacén de datos, podemos aplicar restricciones de seguridad independientes en cada mercado de datos. Este enfoque se muestra en la siguiente figura.

Classification Based on Role

Si los datos están generalmente disponibles para todos los departamentos, entonces es útil seguir la jerarquía de acceso a roles. En otras palabras, si generalmente todos los departamentos acceden a los datos, entonces aplique restricciones de seguridad según el rol del usuario. La jerarquía de acceso a roles se muestra en la siguiente figura.

Requisitos de auditoría

La auditoría es un subconjunto de la seguridad, una actividad costosa. La auditoría puede causar grandes gastos generales en el sistema. Para completar una auditoría a tiempo, necesitamos más hardware y, por lo tanto, se recomienda que, siempre que sea posible, se desactive la auditoría. Los requisitos de auditoría se pueden clasificar de la siguiente manera:

  • Connections
  • Disconnections
  • Acceso a los datos
  • Cambio de datos

Note- Para cada una de las categorías mencionadas anteriormente, es necesario auditar el éxito, el fracaso o ambos. Desde la perspectiva de las razones de seguridad, la auditoría de fallas es muy importante. La auditoría de fallas es importante porque pueden resaltar el acceso no autorizado o fraudulento.

Requisitos de red

La seguridad de la red es tan importante como otros valores. No podemos ignorar el requisito de seguridad de la red. Necesitamos considerar las siguientes cuestiones:

  • ¿Es necesario cifrar los datos antes de transferirlos al almacén de datos?

  • ¿Existen restricciones sobre las rutas de red que pueden tomar los datos?

Estas restricciones deben considerarse cuidadosamente. Los siguientes son los puntos para recordar:

  • El proceso de cifrado y descifrado aumentará los gastos generales. Requeriría más potencia de procesamiento y tiempo de procesamiento.

  • El costo del cifrado puede ser alto si el sistema ya es un sistema cargado porque el cifrado corre a cargo del sistema de origen.

Movimiento de datos

Existen posibles implicaciones de seguridad al mover los datos. Suponga que necesitamos transferir algunos datos restringidos como un archivo plano para cargar. Cuando los datos se cargan en el almacén de datos, surgen las siguientes preguntas:

  • ¿Dónde se almacena el archivo plano?
  • ¿Quién tiene acceso a ese espacio en disco?

Si hablamos de la copia de seguridad de estos archivos planos, surgen las siguientes preguntas:

  • ¿Realiza copias de seguridad de versiones cifradas o descifradas?
  • ¿Es necesario realizar estas copias de seguridad en cintas especiales que se almacenan por separado?
  • ¿Quién tiene acceso a estas cintas?

También se deben considerar algunas otras formas de movimiento de datos, como los conjuntos de resultados de consultas. Las preguntas que surgen al crear la tabla temporal son las siguientes:

  • ¿Dónde se llevará a cabo esa mesa temporal?
  • ¿Cómo se hace visible esa mesa?

Debemos evitar el incumplimiento accidental de las restricciones de seguridad. Si un usuario con acceso a los datos restringidos puede generar tablas temporales accesibles, los datos pueden ser visibles para usuarios no autorizados. Podemos superar este problema teniendo un área temporal separada para usuarios con acceso a datos restringidos.

Documentación

Los requisitos de auditoría y seguridad deben estar debidamente documentados. Esto se tratará como parte de la justificación. Este documento puede contener toda la información recopilada de:

  • Clasificación de datos
  • Clasificación de usuarios
  • Requisitos de red
  • Requisitos de almacenamiento y movimiento de datos
  • Todas las acciones auditables

Impacto de la seguridad en el diseño

La seguridad afecta el código de la aplicación y los plazos de desarrollo. La seguridad afecta a la siguiente área:

  • Desarrollo de aplicaciones
  • Diseño de base de datos
  • Testing

Desarrollo de aplicaciones

La seguridad afecta el desarrollo general de la aplicación y también afecta el diseño de los componentes importantes del almacén de datos, como el administrador de carga, el administrador del almacén y el administrador de consultas. El administrador de carga puede requerir que se verifique el código para filtrar los registros y colocarlos en diferentes ubicaciones. También es posible que se requieran más reglas de transformación para ocultar ciertos datos. También puede haber requisitos de metadatos adicionales para manejar cualquier objeto adicional.

Para crear y mantener vistas adicionales, el gerente del almacén puede requerir códigos adicionales para reforzar la seguridad. Es posible que deban codificarse comprobaciones adicionales en el almacén de datos para evitar que se engañe y mueva los datos a una ubicación donde no deberían estar disponibles. El administrador de consultas requiere los cambios para manejar cualquier restricción de acceso. El administrador de consultas deberá conocer todas las vistas y agregaciones adicionales.

Diseño de base de datos

El diseño de la base de datos también se ve afectado porque cuando se implementan medidas de seguridad, hay un aumento en el número de vistas y tablas. Agregar seguridad aumenta el tamaño de la base de datos y, por lo tanto, aumenta la complejidad del diseño y la administración de la base de datos. También agregará complejidad al plan de recuperación y administración de copias de seguridad.

Pruebas

Probar el almacén de datos es un proceso largo y complejo. Agregar seguridad al almacén de datos también afecta la complejidad del tiempo de prueba. Afecta las pruebas de las dos formas siguientes:

  • Aumentará el tiempo necesario para la integración y las pruebas del sistema.

  • Hay una funcionalidad adicional para probar que aumentará el tamaño del conjunto de pruebas.